您所在的位置: 需求库 技术需求 自动标注数据集的方法及标注系统

自动标注数据集的方法及标注系统

发布时间: 2022-10-13
来源: 科技服务团
截止日期:2022-10-13

价格 双方协商

地区: 贵州省 贵阳市 花溪区

需求方: 贵州***公司

行业领域

电子信息技术

需求背景

图像自动化处理技术在医疗卫生、国民教育、城市交通、大众娱乐等越来越多越多的领域体现了其带来的便利和优势。利用图像自动化处理技术,模拟人类在复杂环境下进行目标检测与识别的研究有着非常重要的意义,其作为图像处理技术的一个分支,在日常生产生活中有着十分广泛的应用,如该技术可以广泛应用在人脸识别、车牌号码识别、机器人导航、自动驾驶等领域。

现有的图像处理中的多标记学习算法主要是从问题转换或者算法改进的思路出发对多标记数据进行建模。问题转换方法将多标记学习问题进行分解或者转换,算法改进方法则通过改进算法的核心思想以适应多标记数据。这些算法都是有监督式的,需要足够多的标记样本进行学习。而且,这些方法都没有对多标记数据进行处理。模型的构建和特征的学习是割裂开的,而数据实例的原始特征往往不是最适合进行多标记学习的。此外,问题转换的算法往往需要解决多个子问题,这些子问题的计算量随着原始数据维度的增加而变得十分庞大。

需解决的主要技术难题

1、传统的多标记学习算法是有监督式的学习方法,需要足够多的标记样本,当标记样本过少时,多标记学习的效果会受到很大影响,然而在多数的分类场景中,已标记的样本都是相当缺乏的,并且不同标记对应的样本存在严重的不均衡现象,这导致对于某些标记来说,已标记的样本变得更为稀缺。

2、问题转换方法将多标记问题分解为多个子问题,这些子问题往往需要从原始特征中构建不同的训练数据,在这个过程中会产生很多原始特征的副本,如果原始特征维度较高,则会产生很大的内存消耗和计算量,导致模型的构建变得非常费时。

期望实现的主要技术目标

1.可以有效降低计算机的功耗,能够自动标记数据集、再训练,最后将单分类数据集合并到一起从而完成多分类。

2.能够避免面对多分类的应用场景时人工数据集标记造成大量人力的浪费,从而减少开发时间,提高了工作效率。

处理进度

  1. 提交需求
    2022-10-13 10:34:52
  2. 确认需求
    2022-10-13 16:31:35
  3. 需求服务
    2022-10-13 16:31:35
  4. 需求签约
  5. 需求完成