國際檢索報(bào)告(International Search Report,ISR)是由“國際檢索單位”(ISA)(世界主要專利局之一)檢索可影響發(fā)明專利性的已公布專利文獻(xiàn)和技術(shù)文獻(xiàn)(“現(xiàn)有技術(shù)”),并對(duì)發(fā)明的可專利性提出書面意見。 最終進(jìn)入國家階段的各國審查部門,可以對(duì)該發(fā)明進(jìn)行或不進(jìn)行重新檢索。比如,根據(jù)歐洲專利法,所有進(jìn)入EP的專利申請(qǐng)的國際檢索報(bào)告,如果是非歐洲專利局提供的,歐洲專利局必須重新進(jìn)行檢索,提供 SupplementaryEuropean Search Report。 這樣,進(jìn)入歐洲國家階段的各國專利局提供的國際檢索報(bào)告,往往可以找到一個(gè)EPO審查員做的歐洲檢索輔助報(bào)告。同一個(gè)發(fā)明,2個(gè)審查報(bào)告,提供了一個(gè)與EPO檢索水平的可對(duì)比性比較。 EPO審查員的檢索水平,一般被公認(rèn)為檢索水平最高。 今天下午4點(diǎn),我們直播如何對(duì)那些國際檢索報(bào)告沒有X文獻(xiàn),而歐洲檢索報(bào)告找出X對(duì)比文件的中國申請(qǐng),通過Patentics的語義檢索,獲取歐洲檢索報(bào)告的X對(duì)比文件的過程和命中率的統(tǒng)計(jì)分析。 至2012年底,采用SIPO遞交PCT的國際檢索報(bào)告申請(qǐng)中,共有11135篇進(jìn)入EP。 根據(jù)歐洲專利法,EPO對(duì)這些進(jìn)入EP的專利申請(qǐng)重新做了SupplementaryEuropean Search Report(歐洲補(bǔ)充檢索報(bào)告)。 例如,EP1367568,中國同族CN1373473,CN1373474。
其中,Documents Cited:有2欄。 Search表示是EPO審查員做的檢索報(bào)告的對(duì)比文件列表,International search report是國際檢索報(bào)告的對(duì)比文件列表。 顯然,這個(gè)ISR沒有X文獻(xiàn),而EPO的檢索報(bào)告,有5個(gè)X文獻(xiàn)。 像這樣ISR沒有X文獻(xiàn),EPO有X文獻(xiàn)的情況,我們發(fā)現(xiàn)有1500多份, 當(dāng)然,這些EPO找出來的X對(duì)比文件,都是英文文獻(xiàn),大多數(shù)是美國專利。 我們就以這些EPO審查員找出X文獻(xiàn)的英文申請(qǐng)作為輸入公開號(hào)。加上該申請(qǐng)的申請(qǐng)日為公開文獻(xiàn)檢索的時(shí)間點(diǎn),不需要其它任何檢索條件,采用 r/ and di/方式,對(duì)1500多篇的檢索結(jié)果,進(jìn)行了自動(dòng)測(cè)試。 利用英文申請(qǐng)公開號(hào)檢索英文對(duì)比文件(EPO審查員模式)的測(cè)試統(tǒng)計(jì)結(jié)果如下, 這是1500多份EPO文獻(xiàn)中,有1259份參與自動(dòng)測(cè)試。其中,54%被Patentics的自動(dòng)排序命中。 排在第一位的有38篇(3.0183%)為EPO審查員找出的X對(duì)比文件。 排在前20位(第一屏),有247篇(19.6187%)。 排在前100篇的有480篇,38.1255%。 在測(cè)試中,我們把EP申請(qǐng)?zhí)栟D(zhuǎn)換成US的同族。同時(shí),把EP審查員引用的對(duì)比文件通過同族找到對(duì)應(yīng)的US專利,進(jìn)行測(cè)試統(tǒng)計(jì)。 現(xiàn)在的問題是,中國審查員進(jìn)行ISR檢索時(shí),不一定能有英文版的申請(qǐng)可以瀏覽。所以,我們進(jìn)一步進(jìn)行如下自動(dòng)測(cè)試。 我們直接輸入中國公開號(hào),對(duì)英文庫進(jìn)行自動(dòng)排序。 Patentics已經(jīng)把1000多萬的中國申請(qǐng)機(jī)器翻譯成英文,并對(duì)這些英文版的中國申請(qǐng),建立了英文語義模型。這樣我們就可以輸入一個(gè)中國申請(qǐng)公開號(hào)(申請(qǐng)?zhí)枺苯釉谟⑽膸熘羞M(jìn)行語義排序。 測(cè)試統(tǒng)計(jì)結(jié)果如下, 這里1500多個(gè)EPO測(cè)試案例,有1423個(gè)參與自動(dòng)測(cè)試,要比直接采用EP申請(qǐng)的美國同族的1259篇要多。 其中721篇(50.6676)被排入前400位。要比直接英文版的54%低4%。這可能是機(jī)器翻譯與人工翻譯的區(qū)別。 如果我們對(duì)比前20、前40等,幾乎都有這個(gè)差別。例如,瀏覽前100篇,直接英文版是38%,而采用機(jī)器翻譯的是34%。也是4%的差別。 下面,我們采用實(shí)際操作來驗(yàn)證我們的測(cè)試方法。 就用ep1367568 為例。 6,028,834的排序位置在第5位。 現(xiàn)在直接輸入中國申請(qǐng)公開號(hào),同樣選擇美國專利庫,排序結(jié)果如下, 同樣去找6,028,834的排序位置。 排在第20位。 因此,當(dāng)大家完成ISR之前,特別是沒有找到X對(duì)比文獻(xiàn),一定用Patentics做個(gè)語義排序。這里,我們必須向大家再三說明,采用Patentics語義排序,是一定不會(huì)漏檢的。排序只是把最相關(guān)的排在最前面,一篇不少。 至于常見使用中,不加檢索要素限制,系統(tǒng)自動(dòng)給出最相關(guān)的400個(gè),并不表示相關(guān)結(jié)果只有400個(gè)。如果你希望10000個(gè),可以在檢索式后面加 and ctop/10000。系統(tǒng)會(huì)把最相關(guān)的10000個(gè)排序出來。 大家一定根據(jù)這些自動(dòng)測(cè)試的統(tǒng)計(jì)分析,來合理估計(jì)瀏覽篇數(shù)。你的努力與發(fā)現(xiàn)X文獻(xiàn)的關(guān)系不是線性關(guān)系,而是一個(gè)指數(shù)下降分布。 瀏覽100篇發(fā)現(xiàn)概率是34%,再看100篇,不是68%,而是43%。這時(shí)候,大家可以通過添加檢索要素來限定排序范圍。 這樣,輸入一個(gè)公開號(hào),利用Patentics排序。就看第一篇,可以降低被EPO審查員找出X文獻(xiàn)的概率3%左右。如果時(shí)間允許,多看幾屏。當(dāng)然,還可以加大家熟悉的檢索策略(不要多,一般一步限制可能解決問題)。多看100篇,后來被EPO審查員發(fā)現(xiàn)漏撿的34%的案子,就可以避免了。 智能語義檢索,世界范圍,就在我們大家的腳下開始。 我們非常感謝中國專利局審查員們對(duì)我們的長期信任和支持! 謝謝大家。完。 《快速梳理集團(tuán)子公司專利申請(qǐng)關(guān)系》 《快速捕獲技術(shù)領(lǐng)域全局趨勢(shì)》 有意入patentics微信檢索、分析技術(shù)討論群者,請(qǐng)加管理員微信,有管理員拉您進(jìn)群。
|
|