安全
价格 双方协商
地区: 北京市 市辖区 海淀区
需求方: 北京***公司
行业领域
电子信息技术
需求背景
⼤语⾔模型的内容安全问题主要包括以下⼏个⽅⾯:
1.不当内容⽣成:由于⼤语⾔模型是基于海量的训练数据,它们有时候会⽣成不当、冒犯性或有害的内容,例如仇恨⾔论、歧视性语⾔、暴⼒内容等。2.虚假信息传播:这些模型有时候会⽣成虚假的信息,可能会被滥⽤来散播谣⾔、误导信息,对社会产⽣负⾯影响。3.隐私问题:⼤语⾔模型可能会在⽣成的⽂本中包含个⼈敏感信息,导致隐私泄露的⻛险。4.版权问题:这些模型有可能⽣成侵犯版权的内容,如未经授权的⽂本剽窃。5.滥⽤问题:不法分⼦可能利⽤⼤语⾔模型来⽣成诈骗信息、恶意软件说明等,从⽽增加⽹络安全⻛险。
需解决的主要技术难题
1.预训练内容安全增强研究;2.模型安全对⻬;3.模型安全性评测⽅法;4.安全攻击⼿段研究等。
期望实现的主要技术目标
课题⽬标是需要结合技术⼿段和道德规范,在保持模型创造性和有⽤性的同时,最⼤程度地减少模型可能带来的负⾯影响。这可能涉及到数据清洗、预训练、模型对⻬、安全性评测等各个阶段。
需求解析
解析单位:“科创中国”工业互联网产业科技服务团(中国计算机学会) 解析时间:2023-10-13
李华康
西交利物浦大学
副教授
综合评价
处理进度