学术论文投稿/征稿

欢迎您!请

登录 注册

手机学刊吧

学刊吧移动端二维码

微信关注

学刊吧微信公众号二维码
关于我们
首页 > 学术论文库 > 经管论文 中国高校科技成果转化的难点识别与对策研究论文

中国高校科技成果转化的难点识别与对策研究论文

4

2026-01-04 17:53:04    来源:    作者:xuling

摘要:我国高校科技成果存量巨大,但却存在转化率低、实际应用欠缺等问题。随着国外对中国的技术封锁越来越广泛,挖掘巨大存量的高技术成果,并将其转化为实际生产力将成为经济高质量增长、解决国内技术“卡脖子”的一个重要途径。

  [摘要]我国高校科技成果存量巨大,但却存在转化率低、实际应用欠缺等问题。随着国外对中国的技术封锁越来越广泛,挖掘巨大存量的高技术成果,并将其转化为实际生产力将成为经济高质量增长、解决国内技术“卡脖子”的一个重要途径。本文对CNKI科技成果转化的摘要进行大文本数据挖掘,利用LDA结合WNA的方法,对转化的问题和解决方法进行识别与分析,发现当前科技成果转化存在高校科技成果服务改革、校企产学研协同、转化体系建设三大困境。此外,基于WNA词网络结构,挖掘解决办法,并从深化转化改革、成立科技成果转化共同体机制、加大资金资助与科学化规划使用三个方面给出建议,为制定政策提供了识别问题和解决问题的新思路。

  [关键词]科技成果;治理;LDA;WNA

  0引言

  科技成果转化是科学技术有效转变为生产力的重要路径,在新常态经济形势下,对推动经济高质量发展起着重要作用。2019年我国发明专利申请量超过美、日、韩、欧专利申请量总和,实用新型专利和外观设计专利申请量分别占全球总量的96.9%和52.3%,全年研发经费22 143.6亿元,位居世界第二[1]。《2022年高等学校科技统计资料汇编》数据显示,2022年,全国高校科研院所向中小企业转让、许可专利达2.9万次,比2020年增长60.2%[2]。我国高校科技成果数量丰富、转化活动持续活跃,但成果转化率偏低,总体转化率最高在30%左右,而发达国家高达60%~70%,然而,企业发明专利产业化率高达48.1%,高校仅为3.9%,高校转化率不足企业转化率的10%。2021年数据显示,我国高校发明专利平均维持年限为4.6年,明显低于全国6.9年的平均水平[3],这说明高校专利整体稳定性不高,难以吸引市场主体进行专利转化。2023年政府工作报告提到“科技政策要聚焦自立自强”,不少委员代表认为,加快科技成果转移转化,让更多的创新性成果从“书架”走上“货架”,对实现高水平科技自立自强至关重要。

  因此,识别与找到科技成果转化难题的热点并研究,对促进科技成果转化能够起到重要推动作用。热点研究方法多样,包括知识图谱、聚类工具、高被引分析和机器学习等方法。近年来随着计算机技术的快速发展,基于关键词的知识图谱的热点研究逐渐成为人们关注的热点。关键词是表达文献主题概念的自然语言词汇[4],其能够高度概括文章的核心主旨和作者的主观思想,关键词词频的变化波动和社会现象、学科发展存在密不可分的联系。当前基于关键词的研究主要有三类:一是基于关键特征词词频的分析,如使用TF-IDF权重词汇结合出现频率的方法[5];二是基于关键词共现算法的方法,如基于Citespace软件进行的热点研究;三是基于全文的大数据文本主体挖掘,如LDA的文本主体挖掘的方法。然而,基于关键词研究热点分析存在诸多不足:一是关键词无法准确概括文本核心内容;二是关键词的数量也会对分析文章起到重要作用[6],简单地将特征词频次累加或进行共现分析或者特征词分析,结果难免忽略文章的内在联系,难以反映本质。本文基于LDA进行科技成果转化主题难点热点识别,运用WNA词网络技术进行词语文本结构挖掘,进行热点问题(难点)的相关词汇追踪研究,为热点信息提取和问题解决提供了一个新的思路。

  1数据来源与研究方法

  1.1数据来源

  科学引文索引文献作为科学技术研究成果的载体,是科研水平的重要体现,又是把握学科领域研究现状、认识热门话题以及了解主流研究方法的重要途径。近年来,文献数量呈指数规模增长,使通过人工阅读方式来获取相关领域信息变得低效和困难[7],科研人员如何从海量文献中把握学科领域的前沿热点主题,预测其演变路径,寻找突破口,成为学界的一个重要方向。摘要是对研究性论文内容不加注释和评论的简短陈述,能够扼要地说明研究工作的目的、过程、方法、结论等,是整篇论文研究结果的扼要概述。本文采用中国知网数据库对高校科技成果转化问题及解决对策的研究热点进行提取,构建文献摘要词网络。检索关键词和检索具体信息如表1所示,获得检索结果后,进行摘要主题识别和WNA分析。

  1.2研究方法

  目前,国内对于科技成果转化的研究成果颇丰,但是在有关文献计量分析方面的研究方法较为单一,多数是运用CiteSpace等知识图谱方法梳理研究热点和研究进展。本文利用大数据与自然语言处理(NLP)方法对科技成果转化领域内文献摘要进行主题模型分析,通过jieba分词技术对目标文献进行分析,使用python进行数据清洗、信息抽取和整理归纳,使用WNA构建特征词网络并对中介中心性进行测量,得到特征词的社会网络结构,准确寻找到科技成果转化问题与治理的关键点。

  1.2.1 LDA主题模型

  潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)主题模型是一种可对大型文本挖掘的三层贝叶斯模型,主要应用于潜在的主题挖掘。LDA采用吉布斯抽样(Gibbs Sampling)。首先从文章中进行主题的采样,也就是从文章中选择一个主题,其次从这个主题中进行词的采样,也就是选出一个词来,不断重复,最后形成整个文档。之后对每一篇文档与生成文档对应生成主题。本文采用困惑度指标(perplexity)即手肘法确定主题数量。主题困惑度常被用于评估主题的拟合优度,如果处于低水平,则主题的结构趋于稳定,其预期误差值也会相对较小[8],计算公式如下:

  其中,e为测试集;p(w)为测试集中的每个词的概率;N为测试集中所有词或测试集的总长度。

  1.2.2 WNA文本网络分析法

  Word-Network Analysis(WNA)是一种文本的社会网分析的分析方法,通过构建文本的网络进行整体词汇的网络构建,将文本解释为单词(组)链,使用POS标记器来检测所有包含内容的单词——名词、动词、形容词和副词,并将每个单词与前面和后面的单词连接起来[9]。并在一定间隔内连接相关词组,从文本中提取网络。通过分析词语网络得到它们包含文本的主要内容,识别中心词语紧密相连的词,停用词典采用《哈工大停用词表》去除修饰词语和无实际意义的语气词语,使这些中心是文本的名词短语(NP),即名词连同属于它们的任何修饰语。因此,这些中心内的词定义了WNA文本网络中的词,并且它们在文本中出现的方式可以使它们之间相互连接。

  2 LDA分析与WNA分析

  2.1文本词频与加权百分比分析

  本文根据文本词组词频和加权百分比进行计算,采用同义词词典对文本中的同义词进行合并,如本文中的发展,同义词库中包含“成长”“发展”“进展”“开发”“生长”“演变”等词汇,具体情况如表2所示(前40)。

  由表2可知,去除不相关词组之后,前40的词组词频均在80次以上,出现了较高的频率。除在搜索过程中出现的词外,“创新、发展、体系、管理、地方、机制、技术、人才、政策、国家、服务、结构、提高、协同、改革”等词组词频上均出现150次以上,且在加权百分比上大部分都大于0.5%。

  2.2 LDA主题提取分析与结果

  采用主题困惑度(手肘法)确定最优主题数。困惑度越小,模型预测精准度越高。从图1可见,主题数在3、6、13时呈现明显拐点,如图1所示。

  通过科技成果转化主题识别的多维尺度分析(IntertopicDistanceMap)展示主题间距离与文档占比(图2),圆圈大小代表含该主题的文档数量,圆圈间距代表主题关联程度。当主题数为3时,各主题聚类间距离较远,区分度良好;主题数为6或13时,存在主题间强重叠(如主题聚类相互交叉),区分度不足。因此,主题数为3时,三类主题的独立性与区分度最优。其中主题数为3时困惑度表现最优,此时的区分度和主题数为6和13时相近,同时可以把主题划分为较少的几个主要领域,结合后续主题区分度分析,最终选定K=3作为最佳主题数。图3右侧的条形图主题词分布概率排名靠前,浅色长条代表主题词对应主题概率大小,深色长条代表主题词与主题之间关联度[10]。以CNKI中科技成果转化难点的文本分析模型情况如表3,文本摘要本文主题的分布情况是见表3,Topic1为39%,Topic2为35.1%,Topic3为25.9%(topic2与topic3图略)。

  基于jieba分词、自定义停用词/词典清洗数据后,通过LDA模型提取3类核心主题,结合主题词分布(图3右侧条形图,浅色代表主题词概率、深色代表关联度)与其前20主题关键词如表3所示。高校科技成果服务改革困境(Topic1)主题关键词聚焦“科技成果、高校、专利、政策、科研人员”等。反映高校科技成果转化改革存在制度协同不足问题:虽有高层政策(如2015年成果转化法),但政出多门导致机制难以协同,科研人员束缚未根本解除。校企产学研协同困境(Topic2)主题关键词围绕“产学研、企业、协同、人才、校企”展开。体现校企合作脱节痛点:企业作为合作主体与高校协同不足,行业高校人才培养重理论轻实践,难以匹配企业一线需求。体系发展建设困境(Topic3)主题关键词涉及“体系、政策、创业、智库、国家地方”等。暴露出系统工程不健全问题:成果转化涉及多部门但体系缺失,创业人才评价机制、政府—高校智库合作、区域人才联动等环节存在短板。

  综上,高校科技成果转化需从制度协同、校企联动、体系建设三方面突破,才能破解改革、合作与系统发展的多重困境。

  2.3 WNA网络分析与结果

  通过对目标文本进行分析,形成WNA特征词的分析网络。节点面积越大,代表该特征词在特征词网络中具有更大的中介中心性。两个节点之间连线越多,证明它们在文档中的联系越紧密,连接线越粗或越密集,证明这些特征词在文中共同出现的频率越高。此外,特征词附近的词语代表两者在文档(上下文)中出现的距离越近,有直线连接证明两个特征词存在上下文的直接的相关性。特征词网络如图4所示。

  文中的主要特征词包括“科技、成果、研究、高校、转化、技术、科研、问题、治理”等。本研究的目的是识别前人研究成果中最为关注的成果转化问题及其解决路径,“成果”与“问题”之间联系最为紧密,这也反映出文档的核心思想。通过对高频中介中心性词汇进行排序和布局,能够根据WNA的连接情况找到关键的连接特征词汇,进而通过选取这些特征词的近邻特征词汇,确定相关研究的主要思想路径。

  通过图4选择研究文档“问题”“困难”作为成果转化研究的主体特征词,其对应的近邻特征词如表4和图4中最深色节点所示。通过分析这些近邻特征词汇可以看出,表示程度的特征词汇有“主要”“缺乏”“深度”等。根据相关近邻特征词汇的中心性,对相似特征词进行同义词合并,如“动机”“目的”合并为“动机”,并将这些词的中介中心性进行加总作为“动机”的中心性数值,对所有特征词进行整理后,结果如表4所示。从表4可以看出,当前研究文献中关注的科技成果转化的主要问题包括:专利质量不高,科技成果转化机制不健全,未能形成企业、研究院所等有效转化体系;成果转化效率不足,难以满足国内关键科技需求;相关转化人员培训不足,不少成果仍停留在概念阶段;高校成果转移规则不清晰,成果管理和评估不够科学,学校成果应用性不强;职务发明与成果转化之间存在矛盾,职务改革深度不够,成果转化观念上重视不足;高校环境重论文、轻转化;财政对于转化的支持力度不足,高校科技成果转化改革深度不够等。

  在解决办法方面,主体词汇为“治理”“解决办法”“方法”“建议”“对策”(如表5所示),程度词汇包括“连续”“提高”“相关”“扶持”,其近邻特征词颜色为中等深度颜色,如图4所示。分析这些近邻特征词汇可得,要解决科技成果转化过程中的问题,首先应建立成果转化的专门机构并配置相应激励体制,尤其在财政支持和引入投资机构方面;制定高校远景科技成果转化规划,形成特色转化案例;加强高校科技成果转化队伍培训,依托资源与政策的协同结构予以扶持,加强项目培训,并依据高校行业特色开展专业转化,加大资金投资支持。科技成果转化外部环境不确定因素多,管理风险和经济风险高。风险一旦发生,若处置不当就会给多方带来重大损失,因此必须建立既能容错纠错,又能降低风险的多方利益保障机制[11],并以项目为抓手促进研究转移转化。

  3结果讨论与对策建议

  本研究采用大数据抓取关键特征词及词网络技术,对知网上302篇关于科技成果转化的论文进行分析。通过两种方法的相互对比,结果呈现出较高的一致性,两种分析方法的科学性得到了验证,为大文本热点识别问题和解决方法提供了新的思路。此外,两种方法也各具特色,LDA主题的识别对大文本的高度主题概括具有明显优势,但对于具体的因素分析来说,WNA对关键因素识别和路径分析更有优势。本文研究结果不仅对当前科技成果存在的主要问题进行识别,还通过WNA的方法对问题的紧要程度进行了初步排序,在制定政策时能够平衡地方政府、高校等多方利益关系[12],有利于为政策制定者在特定情境下对问题的识别和解决提供新的思路。通过综合LDA潜在主题模型与WNA词网络分析两种分析方法的结果,得出我国高校科技成果转化主要有以下三个方面的困境。

  第一,转化服务与市场发展不匹配。首先,当前科技成果大量涌现,但转化机构不足,成果成熟度不高。其次,高校成果转化规则不清晰,职权改革不明确,成果的管理和评估不科学、职权发明与成果转化存在矛盾。第二,校企成果转化双方目标错位。首先,校企合作缺乏沟通与信任,企业重利,期望短平快的成熟项目,而高校注重前沿研究与学术价值,但过于前沿的成果在应用中往往存在先天不足。其次,校企协同研发应用不足,产学研合作多方主体长期处于割裂状态,难以形成高校成果转化共同体,无法实现协同效应。第三,体制机制等体系与市场发展不匹配。首先,成果转化外部环境不确定因素多,管理风险和经济风险高,一旦发生风险,若处置不当便会带来重大损失,除经济损失外,还可能引发政治风险。其次,缺乏高层次的成果转化规制体系,难以协调多方规制矛盾。最后,未能形成特色化人才评价机制,存在转化人员及技能培训不足的问题。

  针对以上问题,需要系统性制定对策。第一,深化成果转化改革。从顶层设计入手,解决基层转化中规制矛盾问题,从高位法律与规制层面统筹协调各转化主体的利益。破除高校“国有资产流失”的“紧箍咒”,解决职务发明与成果的分配问题,实现产学研用等多方利益主体风险共担、利益共享。第二,成立科技成果转化共同体。推动政产学研等多方主体参与,形成政府、企业、高校、研究机构、金融机构、中介转化机构与用户七大主体协同创新机制,建立信息与科研共享协同机制,解决内部协同与信任问题,实现协同效应。第三,加大资金资助,创新协同发展体制。强化成果转化中介及转化人员的“结构洞”作用,加强中介转化人员专业性培训,通过多体系、多层次措施降低转化中的金融风险和法律风险,针对成果转化制定专门的政治容错与金融保险措施。

主要参考文献

  [1]叶琴,蔡建峰,张秋韵.基于隐含狄利克雷分配模型的企业创新测量方法研究[J].科技进步与对策,2024(2):90-98.

  [2]尹双凤.建议全面提高我国高校科技成果转化效率[EB/OL].(2023-03-02)[2024-11-06].

  [3]国家知识产权局战略规划司,国家知识产权局知识产权发展研究中心.2021年中国专利调查报告[R].2021.

  [4]黄晓斌,罗海媛.从会议征文看近五年我国情报学研究热点的发展[J].情报理论与实践,2018(9):31-36.

  [5]刘小慧,李长玲,冯志刚.基于改进的TF*IDF方法分析学科研究热点:以情报学为例[J].情报科学,2017(7):82-87.

  [6]李一平.基于TF-IDF矩阵方法的学科研究热点提取:以《现代情报》为例[J].甘肃科技纵横,2021(12):67-71.

  [7]肖明,商慧语,肖毅,等.基于LDA模型的统计学热门主题挖掘及知识图谱分析[J].华中师范大学学报(自然科学版),2022(5):781-788,802.

  [8]徐红,张斯婷,李凌方.基于LDA模型与共词分析法的农村阅读推广主题发现与热点分析[J].情报科学,2022(10):67-73.

  [9]FRATZ M.Network-Based text analysis to support narrative exposure therapy[J].Psychology,Computer Science,2013:4-6.

  [10]曹晨,罗强胜,黄俊,等.成渝地区双城经济圈科技创新合作现状分析:基于社会网络与LDA主题模型[J].软科学,2022(1):98-107.

  [11]张顺,陈海鹏,张云化,等.科技成果转化共同体的构建模式研究[J].中国高校科技,2020(3):4-7.

  [12]钟卫,陈海鹏,姚逸雪.加大科技人员激励力度能否促进科技成果转化:来自中国高校的证据[J].科技进步与对策,2021(7):125-133.