研究论文
李旺, 冉从敬, 王福新, 刘省身, 张逸人, 何思帆
[目的/意义] 随着新一轮科技革命和产业变革的深入推进,为技术创新提供制度保障的知识产权事业已上升为国际竞争的关键战略领域。专利相似度计算因其在技术路线研判、侵权判定等场景中的基础性作用,成为专利分析领域的重要技术环节,其算法优化与效能提升研究具有显著的现实意义。[方法/过程] 提出一种基于权利要求层级结构的专利相似度计算方法,首先构建技术组合句以增强技术信息表达,其次通过融合标量混合层与Adapter插件的BERT模型提取文本特征,最后设计特征组合模块实现层级特征的分离重组。基于该方法提取文本特征,利用余弦相似度进行专利相似度计算,从而识别相似专利。[结果/结论] 以量子计算领域专利为实验对象,首先通过分类实验验证文本特征提取的有效性,而后通过消融实验证明模型有效性,最后通过相似专利识别模拟实验验证提出的相似度计算方法的有效性。实验表明:①技术组合句构建能显著提升模型性能;②自注意力机制与改进BERT模型增强了特征提取能力;③特征无损融合方式有效提升表征质量。研究为专利分析提供新的技术路径,对知识产权保护具有实践价值。