自然语言处理运行时字段

Master the art of fan database management together.
Post Reply
suchona.kani.z
Posts: 263
Joined: Sat Dec 21, 2024 5:45 am

自然语言处理运行时字段

Post by suchona.kani.z »

计,同时又保持迄今为止运行良好的内容时,这特别有用另一个对开发非常有用的功能是runtime_fields。通常,索引的字段应该在将数据加载到 Elasticsearch 之前声明,就像我们到目前为止所做的那样。或者,可以将字段添加到现有索引,然后更新该索引以对无法使用该字段的文档执行定义的分析。 runtime_fields 允许采用不同的方法:字段的值在运行时确定,即当数据已经被查询或解析时。 runtime_field 的值可以通过搜索 API 提供脚本或通过 Kibana 手动添加来确定。

runtime_fields 在开发过程中或对于外围应用程序很有用。一旦确定某个字段对于所考虑的用例有用,就必须决定该功能是否应该在运行时保持封装状态,或者转换为更永久的存储解决方案。


最后,让我们转向一些更不寻常的事情。如前所述,插件和扩展也是 Elastic Stack 的一部分。 OpenNLP 是一种基于机器学习 (ML) 的自然文本处理框架,可用于各种任务,包括命名实体识别 (NER)。 Elasticsearch 可以配置为加 记者电子邮件列表 载经过训练的 ML 模型来分析正在阅读的文本。为此,必须首先将插件和所需的 ML 模型加载到 Elasticsearch 中,然后定义一个摄取管道,以丰富要使用所需注释进行索引的文本。

结论
这篇博文展示了如何利用很少的资源在 Elasticsearch 中实现基于文本分析和 Query DSL 的启发式搜索。借助 ngram 和语音转换,可以使条目更加容错,并且可以在用户输入时(即,当搜索参数不完整时)提供搜索命中的建议。通过模糊搜索和已开发的搜索启发式的结合,设计了既快速又容错的多层搜索。

1. 您可以简单地使用链接的存储库模板“elasticsearch-demo”在 GitHub 上创建您自己的存储库。然后使用存储库的链接从 GitPod 仪表板创建并打开工作区。工作区设置会自动为您执行,并且代码示例开箱即用。 ↩
2. 免费提供搜索引擎的公司的商业模式不是本文的主题。
3. 如需了解更多信息,请阅读主题为“ Precision and Recall Problem ”的维基百科文章。
您可以在我们之前发布的博客文章中找到来自 adesso 世界的更多令人兴奋的主题。
Post Reply