不需要构建WordNet包,只要将下载的文件解压到适当位置就足够了。
Crossword是一个基于英语单词猜字游戏的生成和计算游戏,它可以和任何字典工作。
WordNet是普林斯顿大学的一个研究项目,目标是建立英语词汇及其词法关系的数据库。
另外,由于过于雄心勃勃,WordNet还没有完全完成,它包含不少错误,仍然在不断的发展中。
这里我实际将使用WordNet模型的子集,仅包含下位词层次结构中“plantlife”之下的那些名词。
Princeton的English语言WordNet项目是一项庞大的公共服务,正在取得不断进步。
我使用和WordNet指针同名的关系建立同义词集间的指针(hypernym、frames等)。
将来的主题包括把WordNet公开为RDF数据库来改进搜索。
著名的词网由美国普林斯顿大学认知科学实验室研制,可进行多种方式的英文词语检索。
我曾经在本专栏最近的一期文章中讨论过WordNet,基本上可以将其作为一种机器可读的词汇表使用。
因此本文将提出到目前为止一直讨论的XMLWordNet系统的RDF表示作为结束。
实际上,它们是我对我的WordNet数据库本地副本的查询返回的索引数字。
属性part-of-speech和target提供了在整个WordNet数据库中惟一标识一个同义词组所需要的全部信息。
现在的任务是利用这种数据结构创建一个工具将WordNet序列化为所需要的XML。
PyWordNet被组织成4个词典,分别对应言语WordNet2.0的4个部分——名词、动词、形容词和副词。
WordNet是一个很大的基于数据的项目,数据的基础都有非常严格的定义。
创建了模型后,可以从文件系统中读入WordNetRDF文档。
sample-gloss的内容来自对WordNet服务器的动态查询。
我还将说明如何使用WordNetXML表示和服务器来改进搜索引擎。
通过非常灵活的Python数据结构访问WordNet数据的库。
后者是用灵活的Python数据结构访问WordNet数据的一个库。
下面我们将编写以XML形式从WrodNet中抽取词法信息的基本代码。
中,我介绍了如何使用基于RDF的WordNet数据库为应用程序专用的搜索引擎增加一些自然语言的能力。
PyWordNet没有附带WordNet数据库文件,这些文件必须单独下载。
我们用了三篇文章讨论如何在XML和RDF应用程序中使用WordNet自然语言语义数据库,这是最后一篇。
这样,您就能够将相关的富数据库信息从WordNet转至用户。
还根据WordNet中的指针呈现到其他含义的链接。