国内或国外 期刊或论文

您当前的位置: 发表学术论文网经济论文》 大数据专业培养内容的主题分析及对图情档学科的启示> 正文

大数据专业培养内容的主题分析及对图情档学科的启示

所属分类:经济论文 阅读次 时间:2022-02-18 10:31

本文摘要:摘要:[目的/意义]在大数据浪潮和新文科背景下,中国图情档学科的人才培养范式亟需改革。与此同时,大数据相关专业的建设方兴未艾,对于图情档学科的人才培养新范式建设具有借鉴意义。[方法/过程]采用一种时序主题网络模型及计算方法;通过搜集、处理、统计、分析259所

  摘要:[目的/意义]在大数据浪潮和“新文科”背景下,中国图情档学科的人才培养范式亟需改革。与此同时,大数据相关专业的建设方兴未艾,对于图情档学科的人才培养新范式建设具有借鉴意义。[方法/过程]采用一种时序主题网络模型及计算方法;通过搜集、处理、统计、分析259所高等院校的大数据专业培养方案文本,在时间维度上进行主题挖掘,总结归纳数据科学课程的层次;分析图情档学科主干知识与大数据专业的联系,并给出适合图情档学科的数据科学课程建议。[结果/结论]结果表明,所采用的时序主题网络模型方法能够较好地契合大数据专业的人才培养范式发展分析,可以成为研究学科主题的一种方法。此外,还给出面向图情档学科的数据科学类课程建议,可供图情档学科的人才培养参考。

  关键词:人才培养数据科学新文科时序主题网络模型

大数据人才培养

  1引言

  “新文科”建设是提升中国国家软实力、促进文化繁荣的重要部分,也是高质量教育体系改革的重点。育人育才是建设“新文科”的关键点,要做到遵循规律、协同育人、模式多元,培养出适应新时代要求的应用型、复合型人才。图书情报与档案管理(以下简称“图情档”)学科因为具有天然的文理交叉性,在“新文科”的背景下,人才培养模式必然迎来重大的革新。在数据科学刚刚兴起时,叶鹰和马费成指出数据科学与信息科学在理论逻辑和技术方法上一脉相承[1]。

  “数智赋能”已然成为图情档学科的新发展趋势,孙建军等[2]认为数据管理与数据分析技术为图情档学科的发展提供了新的可能,赵星等[3]也基于数据智能和知识发现提出了图情档学科的拓展方向。本研究从图情档学科发展难点出发,借鉴大数据专业人才培养模式的建设经验。为分析出大数据专业人才培养发展范式,本研究创新性地利用时序主题网络模型,对259所开设大数据专业院校的培养方案文本进行挖掘,并总结出其课程的三大层次。为助力图情档学科人才培养模式的创新建设,本研究结合叶鹰[4]总结的图情学科主干知识,探索图情档的数据科学类课程建设方案,为图情档学科人才培养模式的创新发展提供依据。

  2困境与思考

  2.1现实问题

  从大多数院校图情档专业所在院系设立的本科专业———信息管理与信息系统专业的发展现状来看,2020年、2021年分别有13所、16所院校撤销了该专业,在普通高校新增撤销本科专业名单中分别排在第3名、第2名。相比之下,大数据专业的开设情况却如火如荼,近两年申请开设数据科学与大数据技术专业、大数据管理与应用专业的学校均超过50所。图情档相关专业最悲观的预测是在10年内“消亡、被合并、被替代、改名、被边缘化”[5]。由此可见,当前图情档学科的人才培养模式亟需改革,要顺应“新文科”的时代洪流推进发展。

  2.2学界思考

  自“新文科”提出以来,很多学者都对图情档学科的未来发展提出了新的思考,如初景利[6]提出图情档学科要发展成“硬学科”,要做到坚持内核的情况下,强化技术与方法的引入。马费成等[7]提出要抓住新文科建设契机,重视交叉融合,同时要坚守人文传统。张九珍[8]提出图情档在“新文科”背景下的学科交叉融合应当做到“以我为主,为我所用”。关于坚持学科内核方面的探讨,叶鹰[4]对图书情报学的主干知识和研究方法进行了总结,为图情档学科的发展明确坚守的依据。周文杰[9]提到,图情档新文科建设需要坚守的“旧”内核包括:基于科学数据建设数据科学、作为基础设施支持数字人文、立足知识组织“编制”数字记忆、坚守公共文化服务的人文情怀、开掘参考咨询的循证决策功能。

  2.3创新发展

  “新文科”的新是创新的新,“新文科”专业人才培养模式的建设,可以借鉴和吸取“新工科”专业的新方法、新技术。图情档学科人才培养新模式的建设,可以结合大数据专业,探索出新的发展方向。从大数据专业汲取经验的思路并非本研究原创,陈沫等[10]研究了情报学取向的数据科学与大数据专业,依次划分出了基础课程、方法类课程和应用型课程。

  陶俊等[11]分析了国外多所iSchool院校的数据科学专业培养方案,为图书情报的数据科学课程建设提 供建议。赵星等[12]利用内容分析法研究了大数据管理与应用专业的培养方案文本。黎海波等[13]研究了信管专业的数据科学课程群建设,为信管专业人才培养模式提供数据科学能力培养的新思路。闫慧等[14]通过设计民族志未来访谈,判断出数据科学与图情学科领域将来最可能是并集的关系。本研究将从大数据专业的人才培养模式中进行探索,为图情档学科人才培养模式提供新思路。

  3大数据专业的主题分析

  3.1大数据专业的基本情况

  国内大数据专业最早开设于2016年,具体开设情况,在2016年,北京大学、对外经济贸易大学、中南大学首先开设了数据科学与大数据技术专业,此后在2017-2021年,分别有32所、248所、203所、143所、62所院校开设了该专业。该专业授予的学位分为工学学位和理学学位两种,厦门大学、中国人民大学、上海财经大学等高校同时在理学和工学对应的学院开设该专业。截至2021年初,开设该专业的院校数量为674所,其中,原“985工程”院校有29所,原“211工程”院校有73所。

  大数据管理与应用专业诞生于2017年,2018年至2021年的开设院校数量分别为5所、25所、52所、68所,截至2021年,共有140所高校开设了该专业,其中,原“985工程”院校有5所,原“211工程”院校有25所,该专业授予的学位均为管理学学位。

  本研究通过邮件咨询、院校官网等渠道,对以上大数据专业开设院校的培养方案进行搜集。其中部分院校的数据难以获取,最终搜集得到了86所大数据管理与应用专业开设院校,173所数据科学与大数据技术专业开设院校,共259所院校的大数据专业培养方案和核心课程。涵盖一流大学建设高校(如北京大学)、一流学科建设高校(如华中师范大学)、其他省部共建高校(如广东海洋大学)、省属高校(如聊城大学)、独立院校(如集美大学诚毅学院)等多个层次的高校。

  3.2大数据专业人才培养模式的主题关系

  为分析大数据专业培养模式的核心主题及整体架构,本研究基于共现技术研究大数据专业培养模式各个主题的之间的相互关系,将培养方案文本进行分词、去除停用词、主题标引等预处理后,对核心主题进行主题关系挖掘,得到大数据专业人才培养模式主题关系弦图。

  分别呈现了数据科学与大数据技术专业、大数据管理与应用专业的人才培养模式主题,弦的不同弧线代表该专业培养方案中的重要主题,弧线长度代表主题的重要程度,弦网络的密集程度代表不同主题之间的关联紧密性。由分析可知,数据科学与大 数据技术专业人才培养的核心点为数据分析,专业核心技术是计算机技术和统计学。大数据管理与应用专业人才培养的核心点是数据管理,专业核心技术是统计学、管理科学和计算机科学。前者重视培养学生的抽象思维能力、数学形式化思维能力、数据科学理论知识、数据科学基础能力等。后者重点培养学生的数据采集、数据处理和分析、数据可视化能力。在大数据专业的培养模式下,学生能够采用数据科学方法对商业、管理中的复杂问题或复杂数据工程问题进行研究。

  3.3大数据专业人才培养模式的主题演变

  S.C.Deerwester等[15]在1990年提出了一种非概率的主题模型潜在语义索引(LatentSemanticIndexing,LSI),而后T.Hofmann[16]实现了基于概率的主题模型,此后基于概率的主题模型逐渐兴起。传统的主题模型不包含时间维度,本研究借鉴廖君华等[17]、A.Bruns[18]、M.J.Westgate等[19]、Z.F.Zhang等[20]、Y.Zheng等[21]研究的时序主题模型,利用切片方法引入时间维度。

  3.4大数据专业课程的三大层次

  由上文分析可知,大数据专业重视培养学生的基础数理能力、数据科学思维能力和数据科学实践能力,近年逐渐开始融合社会科学等其他学科的知识,为学生提供更加多元化的发展路径,相关课程也从基础理论知识、大数据基础应用知识演变为更加广泛的知识。陈沫等[10]在研究大数据专业课程体系时,将其划分为基础层、方法层、应用层共三大层次。

  本研究借鉴其思路,并基于前两节的主题分析,将大数据专业的核心课程划分为3个层次,分别是基础理论与方法层、大数据理论与方法层、综合方法及应用层。基础理论与方法层的课程注重培养学生的基础数理思维和基本数据科学素养,包括统计学类的课程和算法程序类的课程,例如数据结构与算法、Python程序设计与应用等课程。大数据理论与方法层是大数据专业的核心课程培养学生数据科学及大数据的核心素养,包括数据存储与管理、数据采集与加工、数据分析与挖掘、大数据技术4个方面的内容。

  其中,数据存储与管理包含数据库、数据仓库、Hadoop大数据存储等课程;数据采集与加工包含爬虫、数据搜集、信息检索等课程;数据分析与挖掘包含数据建模、统计分析、机器学习、数据可视化等课程;大数据技术包含基本的大数据分析技术课程,如大数据分布式算法等。综合方法及应用层为学生提供了多种方向的选择(不同院校根据自身情况开设),使学生运用数据科学的基本知识,在商业大数据、医学大数据等方向进行实践,能有效激发学生的兴趣,并提升学生的实践能力。例如复旦大学的大数据专业培养方案中,为学生提供了“理医工学大数据分析模块”“社会科学大数据分析模块”“类脑计算方向专业进阶模块”等多个多元发展路径的课程选择。

  4图情档学科人才培养的创新发展

  4.1图情档主干知识与大数据专业的联系

  在汲取大数据专业建设经验,建设图情档学科人才培养新模式的过程中,要掌握图情档学科人才培养模式的核心立足点。S.R.Ranganathan[23]很早就确立了图书馆学的立学原则,主要集中在图书服务方面。随着时代的发展,图情档学科的核心主题有了一定变化。叶鹰[4]经由核心学术凝聚表达了图情档学科的主干知识,层次上包括概念级、理论级、体系级。

  首先将核心学术分为信息组织、信息检索和信息分析,再分别由3个层次细化。信息组织在概念级细化为分类、标引,在理论级细化为分类法、主题法、编目法、索引法,在体系级细化为文献体系、知识体系。信息检索在概念级细化为查准、查全,在理论级细化为布尔检索等搜索算法,在体系级细化为搜索引擎等检索系统。信息分析在概念级细化为广、快、精、准,在理论级细化为引文分析、内容分析,在体系级细化为量化分析、质性分析。基于此,总结出图情档学科人才培养体系的核心主题,主要包括信息组织、信息检索、信息分析等方面。

  需注意的是,不能简单地从大数据专业照搬一些数据科学课程,而是要结合图情档主干知识和院系的具体情况。面向图情档的数据科学课程在数据科学思维和理论层次要求不高,但要重视实践性与结合性。在培养学生信息组织能力的数据科学课程建设中,注意将知识图谱、分类与标引、语义网络等方面的内容引入相关课程;培养学生信息检索能力的数据科学课程建设中,除教学基础的数据搜集与信息检索内容外,还可以结合深度学习、强化学习等知识,在智能信息检索、用户推荐算法领域的应用加强教学;培养学生信息分析能力的数据科学课程建设中,可以设置一些算法与程序课程,例如设置基于JupyterNotebook平台的Python程序设计教学,还可以将前沿的数据挖掘算法、自然语言处理、引文网络分析的基本内容纳入课程内容。

  5结语

  本研究探讨了大数据专业的人才培养范式及主题演变网络、大数据专业的课程层次、图情档学科主干知识及与大数据专业的联系、面向图情档人才培养的数据科学类课程群建设思路以及具体的课程内容,陈沫等[10]提出的课程体系分层和叶鹰[4]提出的图情档学科主干知识对本文具有重要的基础和启发作用。研究提到的基于数据科学建设图情档学科人才培养新模式是一种发展的路径选择,有高校已经将数据科学作为图情档学科自设的二级学科。但图情档也有不少其他的特色方向,例如中国人民大学着力建设的“数字人文”,复旦大学积极推动的“古籍保护与非物质文化遗产”及华东师范大学于2015年启动的“商业分析”探索等。

  无论发展模式如何抉择,做到守正与创新都应是改革的前提。大数据时代下,图情档学科人才培养改革发展刚刚起步,且面临着诸多问题:如何将数据科学课程与本专业的学科特色深度结合?如何使图情档专业的人才培养模式与社会需求相结合?如何使图情档专业的人才培养模式向国际看齐,又不失中国特色?这些问题近年来已有诸多讨论,但仍未有显著共识。此外,方法层面,本研究应用的时序主题网络模型也存在局限性,后续研究可以考虑:①完善科学的切片范围计算指标;②探索更合适的布局计算方法,以清晰、完整地呈现演变网络;③利用PCA降维等方法降低共现的稀疏性。

  参考文献:

  [1]叶鹰,马费成.数据科学兴起及其与信息科学的关联[J].情报学报,2015,34(6):575-580.

  [2]孙建军,李阳,裴雷.“数智”赋能时代图情档学科变革之思考[J].图书情报知识,2020(3):22-27.

  [3]赵星,乔利利,叶鹰.面向数据智能和知识发现的图书情报学跨界拓展———数据-学术-创造整合论[J].中国图书馆学报,2020,46(6):16-25.

  [4]叶鹰.试论图书情报学的主干知识及有效方法:兼论双证法和模本法之效用[J].中国图书馆学报,2021,47(3):58-66.

  [5]闫慧,韩蕾倩,吴萌,等.图书馆学、情报学与档案学2029年发展前景研究[J].图书与情报,2019(6):2-17,153.

  [6]初景利.“新文科”呼唤图情档成为“硬”学科[J].图书与情报,2020(6):1-3.

  [7]马费成,李志元.新文科背景下我国图书情报学科的发展前景[J].中国图书馆学报,2020,46(6):4-15.

  [8]张久珍.图情档学科建设需要与新时代发展接轨[J].图书与情报,2020(6):17-18.

  作者:杨杰1赵星1,2

转载请注明来自发表学术论文网:http://www.fbxslw.com/jjlw/29590.html