数字人文(Digital Humanities)是一个跨学科领域,它利用数字工具和方法来分析、解释和呈现人文学科中的数据和文本,如文学、历史、艺术、音乐和考古学等。文本挖掘(Text Mining)结合自然语言处理(NLP)、数据挖掘、机器学习、统计学和信息检索等技术去发现文本中的模式、趋势和关联,从而帮助人们做出更明智的决策。
本单元利用数据分析以及人工智能技术更好地理解诗词的发展以及背后的规律,帮助我们从数据的角度理解诗词,欣赏诗词之美。 本节课选取其中三个问题:熟读唐诗三百首——如何快速获取唐诗数据,唐诗中的“以人为本”——诗词的字频统计,唐诗何以胜我朝——探索诗歌鼎盛时期,帮助大家理解大数据分析的一般过程,并能动手实践从数据角度挖掘诗词文本中的潜在现象。