您所在的位置: 成果库 自我进化的数据机器人

自我进化的数据机器人

成果类型:: 发明专利

发布时间: 2023-10-02 20:46:21

科技成果产业化落地方案
方案提交机构:“科创中国”工业互联网产业科技服务团| 金仁政 | 2023-11-28 16:09:31

自研国际领先的百亿参数表格预训练大模型“万卷”,结合少样本学习技术、自然语言检索技术与可解释机器学习技术,使得产品在不同领域不同行业达到高度通用的效果。产品面向数据分析师,无需机器学习背景,开箱即用,帮助企业发现更多数据价值,用数据预知未来。团队成员均来自清华大学等知名高校和知名企业,拥有国内在自然语言处理领域最为资深的科学家和最为活跃的青年学者,已获国内顶级创投机构奇绩创坛的种子轮投资。

1.创造了新的数据分析范式,具备精准高效的数据结构化工具、让自然语言数据检索门槛变低、是一个可靠完整的AI数据分析工具; 2.自研预训练大模型“万卷”,让机器读懂数据,具有轻量高效、迁移低成本、对数据敏感程度高的特性,并支持中文网页和制式文件; 3.通过人工智能让人机协同进化,其场景自适应、更新周期短、具有个性化; 4.已在汽车、保险、人力资源行业落地;

根据领英统计,中国数据分析人才缺口达150万人,平均年薪30.98万元,市场规模达4650亿人民币。其中,10%的数据分析师的工作将由数据机器人代替,产生的市场价值为465亿。我们的壁垒在于:

- 技术领先:国际领先的百亿参数表格预训练大模型“万卷”,信息检索、高性能数据存储分析、深度学习底层框架等全面技术点。

- 替换成本:构建企业结构化数据管理平台,将企业数据管理并利用起来,提高客户替换成本,留住数据就是留住客户。

- 数据壁垒:通过数据积累和客户反馈持续优化产品,形成数据积累和客户体验的良性循环,构建数据壁垒和头部优势。

张俊祺,清华大学计算机系本科直博,信息检索与知识管理领域多年研究积淀,曾就职于华为诺亚方舟实验室、摩根大通投资银行,新加坡国立大学访问学者,研究成果获CIKM 2018 Best Overall Paper Award,获评2022中关村U30。团队成员均来自清华大学等知名高校和知名企业,拥有国内在自然语言处理领域最为资深的科学家和最为活跃的青年学者。他们对于信息抽取、预训练大模型、自然语言处理、知识图谱、信息检索等核心技术有着多年的研究积累和业务经验。研究成果曾获ACM国际信息和知识管理会议最佳论文奖项,为大会三十多年历史上华人第三次获得该奖项。团队成员曾获ACM国际大学生程序设计竞赛(ICPC)决赛金牌、世界总决赛World Final,并有着丰富的互联网大厂、创业公司和金融机构从业经验。

打通数据源、搜索、分析全链路的数据分析流程,采用新一代AI技术预训练大模型,更好的场景自适应能力。面向终端客户的SaaS订阅制收费,同时为软件服务集成商和数据库厂商提供license收费。三个渠道:1)自有保险行业丰富的客户资源;2)为数据库、数据湖、湖仓一体企业提供技术接口;2)为软件服务集成商提供技术支撑。

融资金额1000万元,拟出让股权比例10%。