FavoriteLoading
0

资源盘点:有用的文本分析,文本挖掘和信息检索软件

在线文本挖掘&文本分析工具:

商业文本挖掘/文本分析软件:

  • ActivePoint:提供自然语言处理与智能在线目录,基于上下文搜索与ActivePoint的TX5(TM)发现引擎。
  • Aiaioo Labs:提供意向分析、情感分析和事件分析的应用程序接口。
  • AKIN Desktop HyperSearch:含内置的人工智能,将企业级质量的模糊模式识别逻辑商品化。
  • Alceste:文本数据自动分析软件。(可用于开放问题、文献、文章等)
  • AlchemyAPI:世界领先的文本分析服务,每月处理数十亿份文件。
  • Angoss Text Analytics:KnowledgeStudio的一部分,允许用户将非结构化、基于文本分析的输出与结构化数据合并,以执行数据挖掘和预测分析。
  • Ascribe:提供了一个独特的混合技术方法,融合了1999年以来的自然语言处理、机器学习和半自动编码工具。
  • Attensity:提供了一套完整的文本分析应用程序,包括提取“谁”、“干什么”、“在哪里”、“在什么时间”以及“为什么”的能力。然后深入了解人物、地点和事件以及他们是如何关联的。
  • Basis Technology:为分析非结构化多语种文本提供自然语言处理技术。
  • Buzzlogix:帮助开发人员和企业通过基于SaaS的自然语言处理和机器学习应用程序接口来构建更智能的数据应用程序。
  • Clarabridge:为客户体验专业人员提供端到端解决方案的文本挖掘软件,可将客户反馈转化为市场营销、服务和产品的改进。
  • ClearForest:用于分析和文档集合可视化的工具。
  • Clustify:将相关文档分组到集群中,提供文档集的概述并帮助其进行分类。
  • Compare Suite:可比较文本和关键词,突出常见和独特的关键字。
  • Connexor Machine:可发现自然语言的语法和语义信息。
  • Copernic Summarizer:能从不同的应用程序中阅读和总结文档和网页的文本内容。
  • Crossminder:自然语言的处理和文本分析(包括跨语言文本挖掘)。
  • Dataladder ProductMatch:使用类语义技术中使用最好的方法来识别和转换非结构化以及不可预测的数据。
  • DataRPM:提供自然语言的问答和自动数据建模。
  • Dhiti:为文本挖掘提供应用程序接口,可以运行在实时的文档采集和主题与概念的挖掘。
  • DiscoverText:基于云端的文本分析解决方案,拥有许多强大的功能,包括一个主动学习机器的分类引擎。可提供关于雇员、客户、产品和新闻等方面有价值的见解。
  • dtSearch:用于索引、搜索和检索自由格式的文本文件。
  • Eaagle text mining software:使您能够快速分析大量的非结构化文本,创建报告并轻松地传达你的发现。
  • Enkata:为文本分析提供一系列企业级解决方案。
  • Entrieva:对几乎任何来源的非结构化文本进行专利技术的索引、分类和组织。
  • Expert System:使用专有的COGITO平台,通过对语言的语义理解来对非结构化信息进行知识管理。
  • Files Search Assistant:快速高效地搜索文本文档。
  • IBM InfoSphere Warehouse Enterprise Edition:包含了高级分析、OLAP、数据挖掘和文本分析。
  • IBM SPSS Predictive Analytics:用于数据和文本挖掘的套件。
  • IKANOW Infinit.e:一体化的大数据分析解决方案,用于收集和分析结构化与非结构化数据,包括来自Twitter、Facebook和Google+的社交媒体数据。
  • Intellexer:自然语言搜索技术的开发知识管理工具,包含文件比较、文档摘要、可定制搜索引擎和其它的智能软件。
  • ISYS Search Software:一个专注于嵌入式搜索、文本提取、联合访问解决方案和文本分析的企业搜索软件供应商。
  • IxReveal:基于专利的文本分析方法,提供uReveal“插件”高级分析平台和uReka!桌面“搜索和分析”消费者产品。
  • KBSPortal:提供作为SaaS web服务的自然语言处理。
  • Keatext:一个基于云端的文本分析和报告平台,用于对来自非结构化客户反馈的快速分析和可行建议。
  • KNIME:一个开源的分析平台,为当前的文本分析软件提供扩展,包括了Stanford NLP、Palladin和Linguamatics。
  • Kwalitan 5 for Windows:使用文本片段的代码来促进文本搜索、显示概览、构建分层树等。
  • Lexalytics:提供企业级和可托管文本的分析软件,可将非结构化文本转换成结构化数据。
  • Leximancer:制作文本数据采集的自动概念图。
  • Lextek Onix Toolkit:可为应用程序添加高性能的全文索引搜索和检索。
  • Lextek Profiling Engine:根据用户定义的配置文件,可自动分类、路由和过滤电子文本。
  • Linguamatics:供自然语言处理(NLP),搜索引擎方法,直观报告和领域知识的插件。
  • Loop AI Labs:循环认知计算平台的制造商。它结合了HPC定制的硬件和专有软件,
  • Luminoso:类情景感知的文本分析解决方案,由麻省理工大学媒体实验室的一些顶级科学家领导。
  • MeaningCloud,:通过标准的web服务和插件,将非结构化内容转换为可操作的数据,并使用高级文本分析功能,这是一种简单而廉价的方法。
  • Megaputer Text Analyst:提供自由格式文本的语义分析、汇总、聚类、导航和包含搜索动态聚焦的自然语言检索。
  • Monarch:允许你将任何报告转换为实时数据库的数据访问和分析工具。
  • MonkeyLearn:可创建机器学习应用程序的文本挖掘工具。根据你所支付的价格,它能够通过web和API提供分类、提取、集群和回归模块。
  • NetOwl:多语言文本和实体分析,可提取实体、链接和事件,执行名称匹配和身份解析,将纬度/经度分配到地理参考,翻译外语名称并执行情绪分析。
  • NewsFeed Researcher:提供实时多文档摘要工具,可自动生成RSS新闻提要。
  • Nstein:企业级搜索和信息接入技术。在你的公共网站上,Nstein会比其它解决方案更快地引导你的客户获取最相关的信息。
  • ODINText:为消费者和客户服务专业人员提供完整的文本分析软件平台。
  • Ontotext:通过语义技术的混合文本挖掘、推理和图形数据库提供优化的知识管理、搜索和语义的分析解决方案。
  • Picturesafe:语义系统自动对所有信息进行分类和分析,识别不同媒体之间的内容和相似性,极大地加快了新闻出版和出版发行研究的速度。
  • Plagiarism Software:免费的在线抄袭检查。
  • PolyVista:高级的监听、过滤和分析软件与服务,可以帮助你的公司了解一切信息。
  • Power Text Solutions:包含广泛的“免费文本”分析能力,提供商业产品和定制应用。
  • Readability Studio:提供用于确定文本可读性级别的工具。
  • Recommind MindServer:使用PLSA(概率潜在语义分析)来准确检索和分类文本。
  • RightFind(tm) XML for Mining:使生命科学的研究人员能够建立XML格式的全文本的语料库,以便在他们喜欢的文本挖掘软件中使用。
  • SAS Text Miner:提供一套丰富的文本处理和分析工具。
  • Semantex from Janya Inc:企业级信息提取系统,可检测实体、属性、关系和事件。
  • Skyttle API:一种用于情感分析和关键字提取的SaaS平台。支持英语,法语,德语和俄语。
  • SWAPit:提供可视化的文本挖掘和检索功能,包括搜索、术语统计和摘要,能够可视化文本文档之间的语义关系。
  • TEMIS Luxid®:一种服务于商业公司信息情报需求的信息发现解决方案。
  • TeSSI®:用于生物医学文献的语义索引、语义搜索、编码和信息提取的软件组件。
  • Text Analysis Info:为文本分析提供软件和链接。
  • Textalyser:在线文本分析工具,提供详细的文本数据。
  • TextPipe Pro:文本转换、提取和操作的工作平台。
  • TextQuest:文本分析软件。
  • Treparel KMX Text Analytics:为信息专业人员、信息消费者和OEM合作伙伴提供快速、强大的搜索、清晰的视觉洞察和先进的分析。
  • Readware Information Processor:在内联网和互联网中,根据内容对文件进行分类;提供文字和概念搜索;包含一个有英语、法语或德语词汇的概念库。
  • Quenza:从免费的文本文档中自动提取实体和交叉引用,并建立一个数据库进行后续分析。
  • VantagePoint:提供多种交互式图形视图和分析工具,具有从文本数据库中发现知识的强大功能。
  • VisualText:一个综合的文本分析开发环境,在多通道,多范例框架中包含NLP++语言,层次/图形知识库,自动规则生成,单解析树等功能。
  • VP Student Edition:强大的文本挖掘和可视化工具,用于从科学文献和其他字段结构化文本数据库中发现知识。
  • Xanalys Indexer:一个信息提取和数据挖掘库,目的是从纯文本中提取实体,特别是它们之间的关系。
  • Wordstat:回答开放性问题、访谈等文本信息的分析模块,

以上的许多工具也提供了免费或者有限试用版本。

免费和开源的文本挖掘/文本分析软件:

  • Aika:一种用于文本频繁挖掘模式的开源库,使用了神经网络和语法归纳的思想。
  • Coding Analysis Toolkit (CAT):免费、开源、基于web的文本分析工具。
  • Data Science Toolkit:包含了geo,文本,NLP和情感分析工具。
  • Datumbox:一个免费的API,包含了用于情感分析,语言检测,主题分类和快速构建智能应用的多个特性。
  • FreeLing:一个GNU GPL许可证的开源的语言分析工具套件。
  • GATE:一个用于文本挖掘的主要开源工具包,包含一个免费的开源框架(或者SDK)和图形开发环境。
  • Grammarcheck.net:一个用于英语的免费在线语法检查网站。
  • IKANOW Infinit.e open source Community Edition:一个可扩展的用于收集、存储、处理、检索、分析和可视化非结构化文档和结构化记录的框架。
  • INTEXT:自2003年1月2日起,公共领域的MS-DOS版本的TextQuest。
  • LingPipe:一套用于语言分析的Java语言库。
  • Microsoft Distributed Machine Learning Toolkit DMTK:开源工具,包含支持数据并行化、LightLDA,主题模型算法,分布式(Multisense)单词嵌入算法的框架。
  • Open Calais:开源工具包,包括了博客、内容管理系统、网站或应用程序中的语义功能。
  • ReVerb:开放信息的提取软件,不需要关系相关的训练数据,可提取相关的二元关系。
  • S-EM (Spy-EM):一种从正面和无标记的例子中学习的文本分类系统。
  • The Semantic Indexing Project:提供了许多开源工具,包括了语义引擎——一个独立的索引/搜索应用程序。
  • TXM:基于CQP搜索引擎和R环境的Unicode、XML、TEI文本/语料库分析平台,包含了图形客户端。