Named Entity Recognition (NER) 是一项Natural Language Processing任务,它能识别命名实体(NE)并将其分类到预定义的语义类别中(如人物、组织、地点、事件、时间表达式和数量)。通过将原始文本转换为结构化信息,NER使数据更具可操作性,便于执行信息提取、数据聚合、分析和社交媒体监控等任务。
本笔记本演示了如何通过聊天补全和函数调用进行命名实体识别(NER),并用知识库(如维基百科)的链接来丰富文本内容:
文本:
1440年,德国金匠约翰内斯·古腾堡发明了活字印刷机。他的工作引发了一场信息革命,使文学作品在欧洲范围内以前所未有的规模广泛传播。基于现有螺旋压力机的设计,一台文艺复兴时期的活字印刷机每个工作日可生产多达3600页印刷品。
带有维基百科链接的富文本:
1440年,在德国,金匠约翰内斯·古腾堡发明了活字印刷机。他的工作引发了一场信息革命,使文学作品在欧洲范围内以前所未有的规模广泛传播。基于现有螺旋压力机的设计,一台文艺复兴时期的活字印刷机每个工作日可生产多达3600页印刷品。
推理成本: 该笔记本还展示了如何估算OpenAI API的成本。