查字典论文网 >> 专利引用耦合聚类的纳米领域新兴技术识别研究

专利引用耦合聚类的纳米领域新兴技术识别研究

小编:范晓英

引言

新兴技术为正在出现的,具备蓬勃的发展趋势和较大商业潜能的,可能在未来对行业经济或产业结构产生重大影响的技术;其既可以是以前从来没有出现过的技术,也可以是在已存技术经过一段平原期后,新近又在原有研究基础上掀起的技术热潮。其与前沿技术( 高技术领域中具有前瞻性、先导性和探索性的重大技术,是未来高技术更新换代和新兴产业发展的重要基础) 有诸多相似之处。但两者相比,新兴技术的不确定性显然更高,其虽拥有巨大的潜在商业价值,但毕竟只是一种潜在的生产力,未来成功与否还很难定论。前沿技术固然也很新,但其市场潜力是有目共睹,已获得一致认可的。因此,在某种程度上说,新兴技术是前沿技术的前身,而前沿技术是新兴技术的发展成果。正因为如此,新兴技术的识别就更显得意义重大,不仅能及时跟踪技术发展动态,更能尽早捕捉未来的发展契机和可能的变化趋势,这对一国或地区的未来发展至关重要。而从本质上说,新兴技术的识别过程实际上也是一个技术未来发展潜力的评价和预测过程,因此应隶属于技术预测的研究范畴。

纳米科技是21 世纪社会经济发展的重要引擎,近年来已成为众多国家优先支持和发展的战略领域。经过不懈努力,中国现已成长为一个纳米强国,在国际上占有一席之地,并在少数几个基础科学研究领域位居世界领先水平。但纳米作为一个典型的交叉科学技术领域,其发展不仅立足于物理学和化学两大基础科学前沿,还面向电子信息、生物制药、新材料以及精密制造等高新技术领域,发展空间广阔,各项新兴技术层出不穷。因此,若要巩固并提升我国在纳米领域的战略地位,抢占未来纳米科技的制高点,及时准确地识别出其新兴技术并加快相关战略部署将成为一个必要选择。

1 文献综述

诸多学者选择借助专利文献来挖掘新兴技术的相关信息,这是因为专利既能反映出技术价值,又能反映出市场价值。一方面,专利能够体现出技术的新颖性,是技术研发最重要的产出成果,一直被视为技术信息最有效的载体。另一方面,专利能够表现出技术的经济价值和商业潜力,是新兴技术进入市场、商业化可行的一个重要标志。此外,相比其他信息资源,专利文献还具有内容新颖、系统相近、格式规范和分类科学等特点。因此,综合来看,利用专利文献识别新兴技术切实可行,能较好地捕捉新兴技术的关键特征。

目前,利用专利文献识别新兴技术的研究框架主要有两种。第一种建立在所有技术主题皆已知的基础上,即对已知技术集中的各项技术是否为新兴技术展开判别。如Bengisu M 通过对比各已知技术领域专利数量随时间的变化趋势,提取出了其中呈快速发展状态的新兴技术领域。T. S. Cho 和H. Y. Shih 则通过IPC 分类体系和专利引文网络成功识别出了台湾已存的128 个技术领域中具有重大发展潜力的新兴技术。而王鹏则在以德温特手工代码作为技术领域分类的基础上,以社会网络的中心性指标和Citespace的burst 指标为核心构建了战略性新兴技术的识别模型,并将其成功地应用于我国风能产业。这类研究虽然简单高效,但更大程度上属于新兴技术的判别分析,而非真正意义上的新兴技术识别研究。

第二种框架则在子技术主题未知的情况下,直接从目标技术领域的专利文献出发,基于文本挖掘的方法,根据专利文献间的自然联系,如共词关系和共引关系等揭示专利间的距离,并借助聚类分析等方法描绘出专利间的内部结构以及各结构部分的重要特征,从而全面及时地识别出目标领域的新兴技术。如Pter,M. Kinga 和S. Zoltn,et al 以目标领域中各项专利被其他领域专利引用的情况为基础对原始专利集展开聚类分析,提取出了目标领域的子技术集。伴随着这些子技术集在时间维度上的变化和新子技术集的出现,便可捕捉到新兴技术的诞生和发展。而B. Anthony和T. Patrick 则根据热点专利( hot patents) 及其间的共被引关系,对热点专利及其下一代专利(next generation patents,指引用热点专利的专利)进行了聚类,并借助公共部门比例、科学指数、原创性指数和参考指数等指标对下一代专利的聚类结果展开评价,提取出了其中的新兴技术集合。国内学者王凌燕、方曙和季培培等则采用共词聚类、共词网络分析和专利分析等方法建立了利用专利文献识别新兴技术主题的初步框架,并对工业生物技术领域展开了实证研究,最终判定出主题H 为该技术领域新兴的技术主题。

可见,这类研究更为自由全面,是深入挖掘专利信息,及时捕捉新兴技术的重要途径。其关键点之一就是如何对目标领域的专利文献进行有效分类。而目前关于专利聚类的方法主要以下几种:共词聚类、同被引聚类和引用耦合聚类等。在当前相关研究中共词聚类和同被引聚类方法使用得较多,引用耦合聚类则不常见。但有学者指出引用耦合聚类由于具备更强的时效性、可操作性、完整性和稳定性等优点,应被视为比同被引聚类更有效地揭示专利间相似性的重要方法。且多项实证研究也表明相比于共被引聚类而言,引用耦合聚类在探寻研究前沿方面表现更为优异,其识别的研究前沿领域更多,更早且更准确。因此,对专利的引用耦合聚类分析可被作为识别新兴技术的重要方法。

此外,国内目前直接根据专利文献开展纳米领域新兴技术识别的研究还很少,而更多的是以纳米领域的科学文献为研究对象,追踪纳米科技的研究热点或前沿。如郭全珍和吕建国及乔方园、杨萌萌和王雪锋等等均通过追踪相关论文集中关键词的词频变动趋势或网络地位等方法探测出了纳米相关领域的研究热点和未来发展趋势。但总体而言,这些研究更大程度上是对纳米科学研究成果的追踪,与纳米新兴技术的识别还存在显著差别。

因此,本文决定尝试建立基于专利引用耦合聚类的新兴技术识别模型及相关指标体系,并以美国专利授权数据库为数据源( 一方面获得授权专利完整的引文信息,另一方面鉴于美国引领世界的科技创新能力和高度开放性,可将该数据库作为全球技术创新的典型代表),探索和识别纳米技术领域的新兴技术,为我国纳米科技的未来发展提供相关参考依据。

2 新兴技术识别模型设计

1963 年,美国麻省理工学院教授M. M. Kessler 在对《物理评论》期刊进行引文分析研究时发现,越是学科、专业内容相近的论文,其参考文献中相同文献的数量就越多。他把两篇( 或多篇) 同时引证一篇论文的论文称为耦合论文( coupled papers),并把它们之间的这种关系称为文献耦合。同理,专利间也存在耦合现象。当A、B、C、等若干件专利同时引用专利R作为已有技术时,A、B、C、等若干件专利间即产生了引用耦合关系。根据相似定理,专利间的耦合强度可作为专利间相似性的判断指标,继而为专利聚类提供客观依据。

据此,本文结合新兴技术及专利文献的核心特征,构建了基于专利引用耦合聚类的新兴技术识别模型如图1 所示。具体包括收集样本专利、计算专利间的耦合强度、聚类分析、建立新兴技术识别指标体系并判断各子技术领域在该指标体系中的综合表现以及自然语言处理等步骤,以实现直接从目标技术领域的专利文献识别出新兴技术及其技术主题的目标。

其中,新兴技术识别指标体系主要包括授权时间、专利数量增长率和权利要求项数等,其计算方法和所评价的技术特征。

授权时间反映的是技术的新旧程度,某子技术领域的授权时间越晚,则该子技术领域越新专利数量年增长率则描绘了技术的活跃度,若某子技术领域的专利数量年增长率近年来一直为正值且呈现出逐年递增的趋势或连年高于目标技术领域总体的专利数量年增长率,则说明该子技术领域正拥有蓬勃的生命力;权利要求项数度量则是专利质量和技术的未来发展潜力,某子技术领域的权利要求项数越高,则其专利质量越高,未来发展潜力越大。由此,即可对各子技术领域的技术特征进行综合判断,从而识别出其中正在涌现并蓬勃发展的、具有重大发展潜力的新兴技术。

3 实证研究

3. 1 收集纳米样本专利以美专局专利授权数据库为数据源,以美国专利分类977(2005 年,美专局推出了纳米技术专利专属分类977,并对以往的专利进行了追加) 为检索条件,共收集到1976 - 2013 年间9 510件纳米发明专利及其相关著录信息,如专利号、题名、摘要、授权日、技术分类号( IPC)、权利要求项数量和参考文献( 仅限参考的专利文献) 等。经过对数据的初步整理和筛选,删去了其中289 条无参考文献的专利,并利用SQL 根据剩余的9 221 条专利信息建立了一个小型的纳米专利数据库,作为本文的初始样本集。

纳米发明专利年度授权数量可见,近40年来,纳米技术经历了从无到有,再到迅猛发展的成长历程。1978 年,第一件纳米授权专利出现,但此后10年间,纳米专利始终较少,年度授权量保持在10 件以内;自1989 年开始,纳米专利授权量呈现快速增长,虽在2000 年和2004 - 2006 年间出现短暂下滑,但总体上保持了明显的增长趋势,尤其是在近几年,纳米专利授权数量一路上扬,充分展现了其迅猛发展的良好态势。此外,从纳米发明专利年度授权累积量来看,目前纳米技术总体上还处于成长期,未来发展前景广阔,潜力巨大。

3. 2 纳米新兴技术识别依据新兴技术识别指标体系,可进而对各纳米子技术领域的新旧程度、技术活跃度、专利质量和发展潜力展开综合测评,从而识别出其中的新兴技术。

纳米子技术领域4 呈现出了非常明显的新兴技术特征。首先,其授权时间相当晚,为2012 年1 月,这充分反映了该技术的新颖性;第二,从技术活跃度来看,自诞生以来,该子技术领域的专利数量年增长率一直保持在10% 以上,不仅在近三年呈现出了显著的逐年递增趋势,且连年高于核心专利总体年增长率,显现出了其蓬勃的发展趋势;第三,从专利质量和发展潜力来看,该子技术领域在各子技术领域中处于中上水平,未来前景看好。因此,综合来看,子技术领域4 应为我们所寻找的纳米领域新兴技术。

另外需要讨论的是子技术领域3 的情况。虽然该技术总体出现的时间较早,近年来的专利数量年增长率也未出现逐年递增趋势,该技术自2006 年开始进入了一轮新的发展周期,若仅考虑其2006 年后的授权专利,该子技术领域近期的授权时间为2011 年8 月。且近5 年中,除2012 年以外,其专利数量年增长率皆较高且皆显著高于核心专利总体年增长率,尤其是2013 年。此外,该技术的权利要求项数为各子技术领域中最高,这充分显现了该技术的高质量和未来重大发展潜力。因此,经过综合考虑,本研究认为子技术领域3 也可被视为纳米新兴技术,其应属于在已存技术经过一段平原期后,新近又在原有研究基础上掀起的技术热潮,只不过其发展趋势还不够稳定,需密切关注。

3. 3 纳米新兴技术主题识别识别出纳米新兴技术后,需进一步确认其技术主题。在此,本文采用自然语言处理(natural language processing)对子技术领域3和子技术领域4 中各项专利的文本信息展开分析,从而提取出这两项新兴技术的技术主题词。大体步骤如下:第一,搜集纳米新兴技术各项专利的题名和摘要信息;第二,使用Stanford Log - linear Part - Of - SpeechTagger 对上述信息进行词性标注;第三,根据技术术语的构成特征,通过语言过滤器提取出专利题名和摘要信息中的技术术语,其语言过滤器表达式如式(4) 所示;第四,结合各技术术语的出现频率和技术背景等信息,综合判断新兴技术的主题词。((Adj | Noun) + | ((Adj | Noun) * (Noun Prep) ?)(Adj | Noun) * )Noun (4)处理结果发现,子技术领域4 的主题词主要包括:magnetic memory ( 磁存储器),magnetic domain wall(磁畴壁),random access memory( 随机存取存储器),Magnetic tunnel junction ( 磁隧道结) 和storage device(存储设备)等,说明子技术领域4 是一项新兴的磁存储技术。而子技术领域3 的主题词主要有:microparticle(微粒),nanoparticle(纳米粒子),drug delivery system(给药系统),diagnostic imaging ( 影像诊断) 和pharmaceutical agents( 药物制剂) 等。可见,该技术领域主要与纳米颗粒在给药系统和影像诊断等医药领域的应用有关。

4 结论与建议

引用耦合聚类是揭示专利间相似性的重要方法,为描绘专利文献间的内部结构提供了有效途径。因此,本文针对新兴技术和专利文献的核心特征,尝试建立了基于专利引用耦合聚类的新兴技术识别模型,并将其应用于纳米技术领域,成功识别出了两项纳米新兴技术。其中一项主要与磁存储技术有关,是一项新近出现并正在蓬勃发展的技术;另一项则与纳米粒子在给药系统和影像诊断等医药领域的应用有关,属于在已存技术经过一段平原期后,新近又在原有研究基础上掀起的技术热潮。目前,这两项技术正在积极涌现并显现出重大发展潜力,很可能是未来纳米领域的重要契机。因此,需对其给予密切关注和持续跟踪,如有需要应积极制定相关发展战略,开展技术研发和专利布局,力争未来在该技术和相关产业领域中占有一席之地。

可见,本文所构建的新兴技术识别模型具有较高的可行性和有效性,但本文同时也还存在一些不足之处,主要包括以下方面:首先本文使用的是授权专利文献数据,而非申请专利文献数据。鉴于专利从申请到授权间1 ~ 3 年,甚至更长的时间差,采用授权专利捕捉新兴技术的分析结论可能会有一些滞后。但考虑到获得授权是专利质量的重要体现,且目前美专局专利申请数据库中不提供专利的参考文献信息,因此如何权衡上述问题将是未来研究中的一个难题。其次为了优化聚类结果,本文只对耦合连接数大于等于10 的核心专利展开了聚类分析。但在那些被剔除的专利中可能还存在一些最前沿的新兴技术信息,因为新兴技术刚刚萌芽时,可能与其他已存技术间的联系非常少,而往往以个体或者小群体的形式存在,因此在未来分析中还需对这些剔除掉的专利展开进一步分析。

热点推荐

上一篇:从《国防科技大学学报》浅析该校材料学科近22 年来的发展

下一篇:如何对幼儿进行德育教育论文 幼儿园关于德育教育之类的论文