Retrieval Augmented Generation - 2019年12月

Chinese Named Entity Recognition Augmented with Lexicon Memory

发布时间:2019-12-17

作者:Yi Zhou, Xiaoqing Zheng, Xuanjing Huang

中文摘要:

受认知科学中内容可寻址检索概念的启发,我们提出了一种新型的基于片段的模型,该模型通过词汇库增强记忆来用于中文命名实体识别(NER)。在这个模型中,字符级和词级特征被结合以生成更好的可能命名候选者的特征表示。观察发现,定位实体名称的边界信息对于将它们分类到预定义类别是有用的。以分布式表示的形式引入了位置相关的特征,包括前缀和后缀,用于NER。基于词汇库的记忆被用来帮助生成这些位置相关的特征并处理词汇表外的单词问题。实验结果表明,所提出的模型(称为LEMON)在四个数据集上达到了最先进的水平。

一句话总结:

该研究提出了一种结合字符级和词级特征,并利用词汇库增强记忆的中文命名实体识别模型,实现了在多个数据集上的最先进性能。


TauREx III: A fast, dynamic and extendable framework for retrievals

发布时间:2019-12-16

作者:Ahmed F. Al-Refaie, Quentin Changeat, Ingo P. Waldmann, Giovanna Tinetti

中文摘要:

TauREx 3 是针对 Windows、Mac 和 Linux 的下一代 TauREx 行星大气检索框架。它是一个完全重写的版本,采用完整的 Python 栈,使其易于使用、高性能、动态且灵活。新的主要 TauREx 程序在设计时考虑了模块化,使用户能够通过自定义代码扩展其功能,并高效地对自定义参数进行检索。我们通过动态确定拟合参数来实现这一结果,其中 TauREx 3 可以通过一个简单的接口从用户代码中检测到用于检索的新参数。TauREx 3 可以作为一个库使用,通过简单的 'import taurex' 命令,提供与大气建模相关的一套丰富的类和函数。与之前版本相比,前向模型计算速度提高了 10 倍,检索时间减少了六倍,同时保持了稳健的结果。TauREx 3 旨在作为一个独立的全能检索包,而 TauREx 3 的 Python 库可以轻松构建或扩展用户的自定义数据处理流程。

一句话总结:

TauREx 3 是一款高效、灵活的行星大气检索工具,通过模块化和动态参数检测,显著提升了检索性能。