上一篇专利数据统计中需要搞清楚的首要问题(1)介绍了通过合并申请号避免重复统计,理清了专利篇数和专利件数的问题,那么还有一类统计就是对发明项数的统计,这里就涉及到对同一项发明的重复统计问题。上一篇介绍的相同申请号但不同公开号的专利是“同一项发明”,而同一项发明在不同国家申请,也会产生不同的版本,例如阿里巴巴在中国申请某项专利后,为了在欧洲获得保护,又在欧洲申请了相同的专利,由于发明内容相同,也属于同一项发明创造,但公开号和申请号都不相同,这就是我们常说的专利族(同族),在统计阿里巴巴有多少项专利技术时, 就需要去除这些在不通专利局的重复公开版本(也就是同族合并处理),将在不同专利局申请的同一项发明创造合并为一条记录,这样也可以避免重复浏览。
我们再回顾一下专利族的定义,专利族常用的有简单同族和扩展同族。简单同族信息根据DocDB给出的简单同族ID加工,根据定义,简单专利族成员优先权完全一致,等同于“also published as”,是定义较为严格范围较窄的专利家族。扩展同族信息根据优先权信息加工,根据定义,扩展专利族的文献之间至少能通过一个优先权发生关联,是范围更广的专利家族。
WIPO对简单专利族和扩展专利族的定义如图所示。
例如统计阿里巴巴在全球有多少项发明创造,使用(阿里巴巴 OR ALIBABA)/pa选择全球数据库进行检索。什么?你怎么知道阿里巴巴的英文是ALIBABA?如果想知道某家企业常使用的英文名,只需要使用中文名进行检索,然后统计申请人名称选择DOCDB统计项就可以了,DOCDB是欧专局的数据库,会将全球申请人的名称统一翻译为英文。
HimmPat的检索结果显示的XXXX个公开号码,点击下拉框可以对检索结果进行合并处理,包括简单专利族合并和扩展专利族合并,并且提供两层保留条件,例如想要优先看中文的,则首要保留条件选择受理局,优先保留CN文献,其次中国专利中仍然可能有多篇专利属于同一个专利族,例如公开版本和公告版本,可以通过同族代表文献、申请日和公开日设定想要保留的文献。这样针对技术项数的统计结果就会更准确了。
除此之外,HimmPat还对常用的统计参数加工了以申请号和专利族为统计单位的字段。例如:同族数量是非常重要的参数,但以公开号为单位统计同族数量则会有重复统计,因此,分别加工了简单同族公开号个数和简单同族申请号个数,扩展同族公开号个数和扩展同族申请号个数检索字段,甚至同族国家数检索字段,让统计更加准确。
针对引用信息分别加工了引文公开号数量和引文申请号数量检索字段,同时将同一申请号专利的引文算作其共同的引用,例如申请公开版本引用了专利A,授权公告版本引用了专利B,则专利A和专利B都将视作该申请号下所有专利的引文,真正做到以专利为单位的统计。
针对被引用信息,同样将同一申请号专利的施引算作其共同的施引,例如申请公开版本被专利A引用,授权公告版本被专利B引用,则专利A和专利B都将视作该申请号下所有专利的施引专利。
施引专利信息不仅分别加工了施引专利公开号数量和施引专利申请号数量,还分别将同一简单家族和扩展家族的施引算作其共同的施引进行了施引专利数量的统计,分别加工了简单家族施引专利公开号数量、简单家族施引专利申请号数量、扩展家族施引专利公开号数量、扩展家族施引专利申请号数量,甚至相应的施引专利国别数量检索字段。
更进一步,还将施引专利以简单家族和扩展家族为单位进行了施引专利数量的统计,分别加工了施引专利简单家族数量和施引专利扩展家族数量。
没想到因为重复公开的问题,对专利数据的统计有这么大的影响,希望以上字段加工能让你的检索和统计更加准确。
相关阅读:
全球专利高精度智能语义检索上线:25局专利全语种智能语义检索,强劲加持专利人疫情期间高效办公
HimmPat检索功能快速上手指南
用“S系统”,做检索超人
2019年局专利检索大赛机械领域真题能教会你什么
2019年局专利检索大赛电学领域真题能教会你什么
这些隐藏功能你会用吗?
2020“检索之美”专利检索技能与经验有奖征文
107组273项简单统计功能上线
浏览更高效:申请号合并/同族合并功能上线
智能语义更可控:语义检索支持忽略背景技术
智能岂止语义,图像检索上线
沉浸式检索体验之检索历史触手可及
沉浸式检索体验之分类信息如影随形
【检索智能引导功能上线】引导常规步骤,激发检索灵感
【权利要求对比功能】——寻找“安全”实施范围和技术研发空间
同族扩展等12类批量扩展检索上线
这些检索细节90%的检索员不知道
智能附图标记,轻松阅读附图
多项检索功能优化,持续提高检索效率
一键统计三率,270+统计维度绘制统计图表【征集常用统计项】
177可下载字段,自定义导出模板
新增各大专利局相似专利检索智能引导
批量检索方式,你知道几种?
专利数据统计中需要搞清楚的首要问题(1)