本发明公开了一种通用、可配置的高能效池化计算多行输出方法,包括以下步骤:计算高度方向的最大输入行数;计算高度方向的最大输出行数;判断高度方向的分割次数是否为1,大于1,分别求出第一次高度方向输出的行数、输入行数;中间次高度方向输出的行数、输入行数;判断Hout能否被中间次数的高度方向输入行数整除。若不能,确定高度方向分割次数;最后一次高度方向的输出行数=(Hout‑第一次高度方向的输出行数)%中间次数的高度方向的输出行数;本发明采用池化计算多行输出方法,在节省空间和提高效率上找到了一个平衡点,通过设计2D计算单元的存储空间为2倍的1D缓冲区存储空间,既满足通常多行输出的要求,也满足节约电路面积降低能耗的要求。
一种通用、可配置的高能效池化计算多行输出方法,该多行输出方法基于一种可配置的多行输出池化计算处理系统,该处理系统包括上位机的可配置参数计算模块、下位机的可配置寄存器阵列操作控制模块、直接寄存器访问模块、以及计算模块;所述上位机的可配置参数计算模块将操作控制模块中所用到的所有参数都提前计算好,然后CPU将计算好的控制参数通过AXI-lite总线存储到可配置的寄存器阵列操作控制模块,所述的可配置寄存器阵列操作控制模块从CPU获取数据后,存储这些提前计算好的控制参数、并利用这些提前计算好的控制参数控制直接寄存器访问模块的存取操作、以及控制计算模块的池化计算;所述直接寄存器访问模块按照可配置寄存器阵列操作控制模块发送的控制参数、通过AXI4总线从片外存储器DDR中获取与控制参数相匹配的单行输入数据、并将该单行输入数据发送给计算模块;所述的计算模块按照可配置寄存器阵列操作控制模块发送的控制参数,进行与控制参数相匹配的高效能池化计算,并将计算结果用过直接寄存器访问模块发送到片外存储器DDR、由片外存储器DDR对计算结果进行保存;
数据分析:在大规模数据分析中,可以将多个数据处理任务池化为一个计算任务,并通过配置参数来控制输出结果的行数。这样可以提高数据处理的效率和能效。
机器学习:在机器学习算法中,可以将多个训练样本的计算任务池化为一个计算任务,并通过配置参数来控制输出结果的行数。这样可以加快模型训练的速度和提高计算效率。
图像处理:在图像处理中,可以将多个图像处理任务池化为一个计算任务,并通过配置参数来控制输出结果的行数。这样可以加速图像处理的过程和减少计算资源的消耗。
中国科学院深圳先进技术研究院提升了粤港地区及我国先进制造业和现代服务业的自主创新能力,推动我国自主知识产权新工业的建立,成为国际一流的工业研究院。 深圳先进院目前已初步构建了以科研为主的集科研、教育、产业、资本为一体的微型协同创新生AC态系统,由九个研究平台,国科大深圳先进技术学院,多个特色产业育成基地、多支产业发展基金、多个具有独立法人资质的新型专业科研机构等组成。开展先进技术研究,促进科技发展。信息、电子、通讯技术研究新材料、新能源技术研究高性能计算、自动化、精密机械研究生物医学与医疗仪器研究相关学历教育、博士后培养与学术交流。
任务池化:将多个计算任务合并为一个池化计算任务。这些计算任务可以是相似的或相关的任务,可以通过并行计算来提高效率。
参数配置:通过配置参数来控制输出结果的行数。可以根据具体需求和计算资源的限制,选择合适的行数进行输出。
并行计算:使用并行计算的方法,将池化计算任务分配给多个计算单元进行处理。可以利用多核处理器、图形处理器(GPU)或分布式计算系统等来实现并行计算。
输出结果:根据配置的参数,从池化计算任务中提取所需的输出结果行数。可以根据应用需求,选择输出结果的前几行或随机选择行数进行输出。
技术转让
通用、可配置的高能效池化计算多行输出方法可以提高计算效率和能效,适用于数据分析、机器学习、图像处理等多个领域。通过将多个计算任务池化为一个任务,并配置参数来控制输出结果的行数,可以在保证计算结果准确性的前提下,提高计算效率和节约计算资源。