专利是既记载了技术信息,又能反映企业研发、市场、商业行为,甚至是产业发展、政策导向的一种信息载体。单篇专利很难记载和反映上述所有的信息,但是对一定规模数量的专利所包含的信息进行统计、梳理、归纳解读、深度解析后,是能够得出非常多的有价值的信息和结论的。正因为如此,越来越多的企业、行业协会、甚至政府单位开始注重专利信息的分析和利用,试图通过分析专利所包含的信息来为自己的决策提供支撑,这是一个很好的开始,但是如何有效并且合理的利用专利的信息,是需要结合人工智能算法、从业人员的专业技能经验、处理数据和图表的工具及方法等的结合才能完成的。
专利信息分析可以说是个无底洞的工作,从海量专利数据的检索分析到单篇专利的解读,甚至是技术特征的咬文嚼字,如果你有时间做下去,工作可以永无止境。并且专利信息分析不像专利申请一样有固定的格式要求,通常情况下是很难标准化(基础分析除外)的,因此,解读出做专利信息分析的目的就显得非常重要了。在这里,笔者尝试从不同层次来尝试对专利信息分析与利用做归纳。
一、大数据分析
通过预设的算法和图表样式将检索出来的专利自动生成一份分析报告,这类型的专利分析报告利用专利本身自带的著录项目信息,或者通过预设规则将著录项目信息和专利文件本身衍生出新的信息数据(比如届满时间、权利要求项数等)来进行简单的归纳总结。其中人为参与的地方除了检索和数据的筛选之外,更多的是表单的设计(大部分数据库系统目前都支持自定义表单)和图表的简单解读。
这种报告反映出的信息量有限,但是执行的效率高,而且信息准确性高,下图就是从某知名数据库系统自动生成的简单图表,当然还能生成自定义的复杂图表。
这类型的分析报告能够快速的反应出与调查标的相关的专利申请趋势、权利人分布、类型、有效性、按照IPC分类号得出的技术分类等信息,但是这些信息往往只能满足调研者的基本需求,或者对调研需求者的价值度较低。因此,还需要对专利信息进行二次挖掘归纳,并且加入更多维度的分析,才能提高价值。
二、人为归纳梳理
对一篇专利进行信息的二次挖掘归纳已经有很多成熟的做法,比如对专利归纳出技术节点、产品节点、功效节点等等,也可以根据专利记载的信息加上设定的评估指标,对单篇专利加上价值指标、品质指标等标签。这里所指的技术节点、产品节点、功效节点绝不是通过人工智能算法来识别IPC分类号和关键词来归纳和标引的。而是通过跟本领域技术人员充分沟通,事先形成一份较为客观和完整的关于调查标的的产品树、技术书和功效树,然后将检索的专利进行对应的节点的归类和打标签,这个打标签的过程是可以借助关键词、IPC分类、二次检索等工具方法的。这部分工作是工作量最大,也是最影响分析结果准确性的步骤。完成这部分工作之后,能为专利信息分析工作往更全面、更深入、价值度更高的方向进行创造条件,由此产生的图表分析也更加复杂和多元化,能匹配企业的决策层、研发、市场、人事等对专利信息分析利用更多的需求。
举例说明:比如企业想通过专利来精准的识别研发人才,可以将发明人名字、时间、技术分支(二次挖掘归纳获得)等结合,形成一个针对特定发明人研发持续性、深入性、广泛性的分析图表,来辅助决策,如下图:
从图中明显可以看出,如果企业想找技术节点1的专家,找杨工可能比较合适,如果想找对标的产品5个技术节点都比较熟悉的专家,综合考量陈工应该是比较合适的人选。或者调研需求人想知道某竞争对手在某个产品或技术上持续创新的能力,也可以通过技术/产品与时间的关系来分析参考。
总的来说,在加入了人为对专利的二次信息挖掘归纳后,专利信息分析的图表组合方式、分析维度会显著增加,并且每加入一个归纳标签,组合方式就至少翻一倍,而且还能进行一个X轴对应一级/多级Y轴,或者一个Y轴对应一级/多级X轴的复杂图表绘制。
三、多维度信息的结合
专利的信息分析与利用最终是要服务于企业、政府等主体做决策的,而无论是基于专利既有的标签还是人为归纳梳理的二次标签,都只能反映出技术相关的事实和有限的预测,虽然由此产生的信息量已经非常大而且利用价值非常高了,但是对于深层次的商业行为、产业导向的信息反馈还是有所局限,此时就需要引入多维度的外部信息进行综合分析,而不是单纯将专利信息进行割裂分析。这里可以并入分析的多维度信息就非常多了,比如:企业投资并购信息、企业的产业地位、企业的竞争态势和专利风险、核心技术人员的引入与离职、地区政策导向、企业的产品类型、市占率等等。举个很简单的例子,调研过程中发现,某家竞争对手频繁有企业并购行为,但是通过专利数据分析每次并购都没有将专利纳入其中,如果将商业信息和专利信息合起来看,大概率可以判断这家企业并购的目的可能是扩大产能或者其他,增加自身技术实力的目的并不明显,这时候企业就可以针对性的调整自身的应对策略。
四、追根溯源
专利信息分析除了采取常规的人工智能进行大数据分析和引入人工分析标引外,笔者认为在执行分析过程中很重要的一点就是要学会识别“异常数据”,所谓的“异常数据”是指的专利的空白点、密集区域、重点发明人、家族专利特别多、转让次数特别多等等数据信息,对这些数据进行深挖,往往能得到非常有价值而且意想不到的信息。这些异常数据并不是一开始就那么显而易见,需要从宏观数据逐步深挖,不放过每一个“异常数据”提供的线索。当然,就像前面所提到的“专利信息分析可以说是个无底洞的工作”,对于数据信息的深度挖掘也需要结合调研需求方的需求。
专利信息分析是非常复杂、同时也非常有趣和有价值的一项工作,除了对专利专业知识的掌握之外,对于技术的理解和熟悉、沟通能力、工具的使用、经验方法的积累以及综合分析的逻辑思维能力都要求非常高。