您所在的位置: 成果库 德尔塔的“德尔塔TxM文本挖掘系统”

德尔塔的“德尔塔TxM文本挖掘系统”

发布时间: 2021-08-25

来源: 试点城市(园区)

基本信息

合作方式: 技术服务
成果类型: 软件著作权
行业领域:
新一代信息技术产业,信息传输、软件和信息技术服务业
成果介绍

企业简介

天津德尔塔科技有限公司,是天津市高新区一家专注于大数据、人工智能相关产品研发和服务的公司,具有国家高新技术企业、科技型中小企业、ISO9001质量认证、天津市雏鹰计划企业等资质。公司致力于大数据分析、数据挖掘、自然语言处理等大数据和人工智能相关产品研发和推广应用。公司核心团队来自于西安交通大学、天津大学、大连理工大学、哈尔滨工程大学等著名高校,拥有15年左右的大数据、人工智能产品研发和实施经验。

公司凭借团队在大数据分析领域10多年的技术积累,研发出了覆盖大数据采集和处理、结构化数据分析和挖掘、文本分析和挖掘等领域的大数据产品,掌握了大量核心技术,拥有20项大数据和人工智能相关软件著作权证书,6项人工智能相关专利,获得天津市科技进步奖一项。自主研发的数据挖掘、文本挖掘产品在功能性能上与国内外同行相比,具有显著的竞争优势。相关产品已经在审计、档案、国防、电力、新闻出版、智库、税务、零售、航天、公安、质检等众多领域得到广泛应用。目前典型的客户包括国家审计署、工信部、国防科工局、航天科技集团、国家电网、南方电网、各省市档案馆、各战区等。

产品简介

德尔塔TxM文本挖掘系统,是天津德尔塔科技有限公司自主研发的分布式文本挖掘系统,是公司团队在文本挖掘领域8年多技术积累的结晶,用于帮助企业、政府机构等利用自然语言处理技术自动从海量的word、pdf、网页等文档类数据中发现有价值的信息和知识,帮助用户对海量的文档数据进行高效深度分析和利用。典型应用场景包括档案文献的深度分析利用、知识库中的文档分析利用、工程资料的高效分析、海量合同文件高效分析、海量舆情数据分析、海量新闻数据分析、法律法规分析、专利科技成果分析利用、电力病例分析利用、客服录音文字分析等。

产品提供多达30多种文本挖掘和自然语言处理算法模型,典型算法包括中文分词、领域专有词库自动构建、词频分析、关键词抽取、摘要自动生成、文档比较、相似分析、文档聚类、文档分类、舆情情感倾向分析、新闻话题聚类、人名机构名抽取等。该产品具备100多万高质量精选词库;单机分词速度达到30M/秒以上,远高于其它产品2M/秒的速度;基于深度学习技术的词性标注、文档分类、命名体识别等算法准确率远高于其它产品。产品在国产CPU、操作系统、中间件、数据库之上均能稳定运行。

图片

既往成功案例

审计署金审三期大数据中心项目、国防科工局数据资源中心项目、南方电网审计机器人项目、国家电网非结构化数据审计分析系统(4个省)、某战区各部队大数据分析平台、全球国防预算信息研判平台、国家信息中心行业协会商会信用信息平台、安监总局安全生产事故预防大数据分析系统、智慧档案馆(8个地市)、人民公安报社大数据中心、中科院专家科技论文收录引用分析系统、主播弹幕数据分析系统、北京房山经侦大队经侦数据分析项目、新闻出版署数字报刊大数据分析系统、信息通信研究院模块化成果库大数据分析系统等。

成果亮点
团队介绍
成果资料