您所在的位置: 成果库 TRS数星智能风控大数据平台

TRS数星智能风控大数据平台

成果类型:: 发明专利

发布时间: 2022-11-13 17:12:25

科技成果产业化落地方案
方案提交机构:成果发布人| 倪晶 | 2022-11-13 17:12:25

TRS 数星智能风控大数据平台,是一款利用人工智能、大数据、自然语言处理、知识图谱技术构建的综合型在线服务平台。平台围绕海量异构数据,全面监控海量金融实体多维风险。平台提供智能多维标签、预警信号推送、风险事件跟踪、风险传导关联、综合异构图谱等贯穿多场景全流程风险管理功能,提升金融机构风控能力。目前平台在风控、合规、投研、监管等核心金融场景得到广泛应用。

1、自研AI分析引擎自主研发的语义智能分析引擎,可支持文本分类、文本聚类、实体抽取、关系挖掘、数据比对、情感分析等多种核心自然语言处理技术,核心文本分类准确性超85%。其核心特点包括:1)融合了自然语言处理、机器学习、数据挖掘、深度神经网络等技术,并持续追踪最新的前沿技术,不断更新产品。2)丰富的语言学知识,包含分词词典、多行业主题词词典、语义词典、多语翻译词典等多种词典。3)完备的文本挖掘功能模块:包括文本分类、文本聚类、文本摘要、相似文本检索、信息抽取、语义关系抽取、情感分析、智能问答、机器新闻写作、热点发现、文种识别、拼音检索、相关短语检索、(政治)常识校对 、数据比对、高速串匹配、跨语言查询翻译、语义词典挖掘、新闻短标题生成等功能。4)高效的文本处理速度:对多数功能模块而言,单文本挖掘服务器平均能达到每秒几百条文本的处理能力。5)提供国产化介质,支持Intel、NV、飞腾和龙芯等不同体系结构的国产化硬件环境。

应用“一种高效倒排索引组织方法”发明的“TRS海贝搜索引擎数据库”可实现全文检索数据库国产替代

当今的全文检索数据库市场,基本上处于开源软件ElasticSearch一家独大的局面。Elasticsearch是一款基于Lucene的搜索服务器,可以提供分布式多用户能力的全文搜索引擎。ElasticSearch自发布以来,凭借高效的性能,开放的架构,以及开源免费的商业模式迅速占领了全文检索的市场。目前国内外很多企业已放弃自主研发全文检索数据库,逐渐转投ElasticSearch阵营,而还在坚持全文检索数据库自主研发并保持技术领先的企业凤毛麟角。

随着ElasticSearch的市场占有率越来越高,暴露出的安全问题也逐渐增多。2019年底发生的用户隐私泄漏事件,致使超过27亿个电邮地址(有10亿个密码是简单的明文)被盗,其中不乏我国的互联网大牌供应商;2020年初,又爆出黑客入侵超过1.5W台ElasticSearch服务器事件,以上问题对用户信息安全造成了极大的威胁。

数字时代,数据检索在数据管理中的重要性大大提高,没有高效的检索,大数据几乎无法可用;没有准确的检索,大数据的分析挖掘手段也难以施展;特别是互联网搜索引擎普及应用以后,在一个基于大数据的应用系统里,没有便捷的搜索引擎更是无法想象的。从原理上讲,作为一款大数据管理系统,数据存储并不是目的,存储数据的目的是通过数据分析来挖掘数据价值。

拓尔思信息技术股份有限公司(简称“拓尔思”)成立于1993年,是中文全文检索技术的始创者,领先的大数据、人工智能和数据安全产品及服务提供商。公司2011年在深圳证券交易所创业板上市,股票代码300229。公司净资产近30亿元,拥有员工2000余人,在全国设有4大区域中心31家分公司。自成立以来,拓尔思始终坚持核心技术自主研发,拥有30+发明专利、 800+软件著作权,一直引领全文检索和搜索引擎数据库、自然语言处理(NLP)技术的原始创新和应用场景落地,成功服务了多个国家级重要信息化项目的建设,成为国家企业信用信息公示系统、信用中国、国家知识产权检索系统、GA云搜索等国家级基础设施的数据管理和检索引擎。公司产品曾获得国家科技进步二等奖、上海市科技进步一等奖、中国电子学会一等奖、北京市科技进步二等奖、王选新闻科技特等奖等多项重要荣誉。

目前平台汇聚了数十亿多源异构数据,每日增量百万级,实现实时监控七千多万家企业。结合自然语言处理技术和专家经验,现已积累1000多个算法模型、5000多个标签。为银行、保险、信托、融资租赁、资管等客户提供丰富的场景知识挖掘能力,助力企业精准化管理业务运营。

 

平台已服务众多行业标杆客户,如国家开发银行、中国进出口银行、中国银行、平安集团、中国人保财险、新华财经、招商银行、深交所、人民日报、新华社等,全面应用于金融、企业、政府等多领域。

著作权直接转化成产品