核心内容摘要
泪洒伽罗,太华之巅的爱恨情仇:一部让你肝肠寸断的免费小说
从Salesforce、SAP Ariba或NetSuite等企业工具中提取数据相对容易但让这些数据能够被AI模型理解和推理却困难得多。
仅仅拥有大量表格、列或巨型多维JSON文件并不能帮助模型对数据进行有效推理。
这里缺少的关键要素是数据生成时的业务上下文。
专注于帮助企业从软件即服务SaaSAPI源提取数据并为分析或AI应用做准备的Precog公司今天推出了一项新功能将把业务上下文重新带入数据提取过程中。
Precog首席执行官Jon Finegold在发布前的采访中表示为AI分析手动准备数据的过程可能需要数月时间。
当你进入企业环境想要开始分析关键业务数据时这些数据往往分散在各种应用程序中有时企业中会有超过100个应用程序Finegold说。
从这些应用程序中获取数据的过程——不仅仅是提取和加载还要为其提供足够的上下文让模型能够真正理解数据——这是一个非常手动的过程。
尽管大语言模型的能力不断增强但在处理大量数据推理时也不够可靠。
如果有人听说要把所有数据发送给Gemini不仅分块和Token化等过程成本极高而且每次调用得到的答案都会不同Finegold指出。
为了解决这些问题Precog采用了不同的方法来帮助客户从数据中获得更多价值。
当Precog用户想要配置新的数据源用于AI应用时他们现在可以广泛描述自己的用例例如我想了解哪些客户最有利润哪些让我们亏钱。
然后Precog将使用其现有的ETL功能查看SaaS应用中的可用数据仅提取特定用例所需的字段并添加必要的上下文来帮助模型理解每个字段的含义。
这里需要注意的重要一点是Precog实际上从不向大语言模型传递公司数据。
相反它将实际数据加载到数据仓库中只向其语义引擎传递元数据。
Precog构建这个系统的一个巧妙之处在于它还使用另一个模型自动创建数百个潜在问题——可以将其视为合成问题生成。
正如Precog首席产品官Becky Conning所说这里的想法是生成一个问题矩阵让大语言模型能够生成语义模型来回答所有这些问题。
Conning认为这一切都是必要的因为简单地构建一个与单个标准化表绑定的巨大语义模型只能回答非常有限的问题集。
同时包含所有数据也行不通。
如果你包含所有数据——这些应用程序中的一些可能有数十万个数据集由于JSON结构每个数据集可能不仅代表一个表还可能包含分解后的维度信息——那么Cortex就无法工作。
实际上任何这些自然语言查询大语言模型都无法工作。
现代大语言模型的优势在于它们非常擅长将自然语言查询转换为SQL因此为了查询数据Precog不直接依赖模型——也不向该模型提供数据——而是使用Snowflake的Cortex NLQ大语言模型。
该服务也可以使用其他大语言模型但团队表示他们确实喜欢Cortex NLQ用于这种用例。
总的来说这看起来是一种聪明的方式利用大语言模型最擅长的能力而不是试图将它们硬塞到更可能失败而非现有技术的用例中。
QAQ1Precog的新功能能解决什么问题APrecog的新功能主要解决企业数据缺乏业务上下文的问题。
虽然从企业工具中提取数据相对容易但让AI模型理解和推理这些数据却很困难。
该功能可以自动为数据添加必要的业务上下文让模型能够真正理解数据的含义大大简化了原本需要数月的手动数据准备过程。
Q2Precog如何保护企业数据安全APrecog在处理企业数据时采用了安全的分离架构。
它从不将公司的实际数据传递给大语言模型而是将实际数据加载到数据仓库中只向语义引擎传递元数据。
这种方式既能利用大语言模型的能力又能确保敏感的企业数据不会泄露给外部AI服务。
Q3Precog的语义模型是如何工作的APrecog使用智能体自动生成数百个潜在问题创建问题矩阵让大语言模型能够生成语义模型来回答所有这些问题。
它不是构建单一的巨大语义模型而是根据具体用例只提取必需的数据字段。
在查询时系统利用现代大语言模型擅长将自然语言转换为SQL的优势通过Snowflake的Cortex NLQ来处理查询。