2009年1月25日

Google VS. Copernic 桌面搜尋(desktop search) ~~論文寫作觀點評比

之前在這篇文章: 使用好工具來幫助你的報告/學術論文寫作,提到寫論文的三大步驟,

先聲明,這裡指的資料搜尋指的是你電腦裡的PDF文獻資料(以英文為主),當然word等一般文件檔也沒問題。而我平常習慣把下載的PDF檔都放在同一個資料夾裡,至多再以主題分子資料夾(註一)。

寫論文時一定遇過這種情況:「阿,我要引用某篇paper裡的這樣某一句話、某個關鍵詞」。
蒐集紙本資料除非你有瞬間記憶能力(有這能力就不要當研究生了,好嗎?),否則一般來說搜尋PDF檔比較實際。以往我是用Foxit Reader的全文搜尋以及跨文件全文搜尋來作,但是Foxit並不支援分散的關鍵字搜尋(就像google那樣),一定只能"whole word"模式。

順著這個理路,那乾脆就用google desktop search (GDS)吧!
沒錯,寫了這麼長的引言,就是為了要介紹GDS這個桌面搜尋服務。

GDS雖然被滿多人詬病太耗資源、索引檔太大,但因為我有搜尋內文的需要,也只能乖乖安裝。
同時GDS給我一個迷思:「只要能夠搜尋內文,我就可以找到我要的資訊。」

這個迷思直到另一個桌面搜尋軟體: Copernic Desktop Search (CDS)出現才被打破。

請先參考這篇文章:研究生必備!超好用檔案搜尋軟體 Copernic Desktop Search,介紹CDS主要特色。

而以下就專以搜尋PDF的部分來作GDS與CDS的優劣比較。

  • 快速搜尋框(quick search box),在CDS裡叫"desk bar"   

GSD快速搜尋框的隨打隨找滿好用 但是要進階搜尋就非常麻煩
除了打入關鍵字,要限定資料類型 filetype:pdf,要限定檔案位置 under: "d:\pdf"
越輸入越多,原本隨打隨找的優勢完全消失。而且要記這些進階搜尋的指令畢竟不太親切。GDS box

CDS的desk bar是常駐在工作列上,也有快速鍵搭配使用
沒有隨打隨找(要用付費版),資料類型可以利用上面按鈕進行分類

CDS box

小結:其實從論文寫作的角度,快速搜尋框是沒有意義的(毆)。
快速搜尋是在你想要找到某個特定檔案名是最好用,但要找文件內文,這並不是我們要的結果。
另外,要快速找檔名,另一個殺手級搜尋軟體:everything,比起GDS或CDS都優秀許多。參考:Everything:搜尋檔案、文件檔名的殺手級軟體~~好快的刀

  • 主搜尋視窗(main search window)

GDS是依附在瀏覽器下。在主視窗有簡單的檔案類型選擇(但遠遠不足)。
同時你還可以看出我是乖寶寶,每一篇論文都一定按照「作者 年代 篇名」的格式命名。
只是GDS有個非常詭異之處,顯示結果是PDF的property,路徑檔名以綠色另外標示。
因為他去讀PDF property,顯示結果變的混亂,一下子路徑檔名、一下子是期刊編碼、一下子是期刊篇名。
此外,GDS只列出關鍵字的那一句話,這樣的結果呈現,對於我們的目的根本沒有幫助。即使有預覽按鈕,但就是顯示全文,一點用也沒有。

GDS

CDS的主搜尋視窗比起來就太優秀了。
鍵入關鍵字後可以直接在上方選擇資料類型。在file tab下可看到PDF檔。
預設檔案是以資料夾分群,同時檔名中的關鍵字會加上底色
要更進一步限制搜尋,可從邊欄的refine設定條件,包括檔案類型、時間、位置等,相當直接了當的介面。

同時最驚人的是他的預覽功能。選取檔案後下方出現預覽結果。
看到預覽視窗上方的令人興奮的關鍵字嗎?CDS把內文中的關鍵字都加上底色,並且按上方的按鈕就可以重複搜尋。
這時你可以加上一點技巧:"AA BBB"來搜尋固定字串。使用多個字串來搜尋哪些論文同時包含你所要的不同概念

這就是我們想要的搜尋!

CDS_pdf

小結:就PDF的搜尋來說,CDS幾乎已經滿足我們所有的需求。
雖然沒有中文介面,搜尋中文的功能也還不完美。
但簡潔直觀的介面及豐富的自訂功能,特別在內容預覽及標示搜尋上的功能更是桌面搜尋的佼佼者。所佔用的資源也相當少。確實是PDF資料搜尋最好的方案之一。

---  
註一:以資料夾來管理文件,要是某篇論文隸屬多個主題,同時放多個資料夾,絕對還是會出問題
--
God Loves You.
ChunMin Chou,Dep of Psychology,National Taiwan Univ

6 則留言:

  1. Your blogger has so many useful information~^^

    回覆刪除
  2. thanks for your kind response.
    I'm glad that my post helps.^^

    welcome back in the recent future.

    BTW your blog is very cute.

    回覆刪除
  3. 我的命名方式是
    (1)在母資料夾放all papers
    命名方式:【作者名稱(年代)-paper名稱】
    (2)開子資料夾(命名:要讀的主題)
    裡面放母資料夾那邊paper的【捷徑】
    降的好處有二:
    1.全部只會有一個paper,不用不同資料夾間複製、更新
    2.用everything搜尋paper名稱時,可以發現它屬於那些子資料夾(也就是他跟我相關的主題)
    ps.(剛想到,還沒試過)若要在子資料夾內放開啟快速的txt檔,命名成paper名稱當作該paper該主題的紀錄也不錯

    回覆刪除
  4. CDS 感覺爛透了 ,昨天問台北的代理商 ,一套專業版超過台幣2千元 .網路一個月試用版 ,昨天一直出現輸入帳密無效 ,今天突然可以進到試用版 ,卻找不到可以設定的畫面 ,也找不到 Search 在那 ?比 Google desktop 還爛 ,只可惜 Google 去年9月已經停用 .

    回覆刪除
  5. 另外 CDS 沒有中文介面 ,我懷疑如果要查中文 ,是否查的到 ?

    回覆刪除
  6. 查中文檔名、內容都沒有問題,不過話說回來,我現在也很少用到他了
    看來是有些改版及變動

    回覆刪除

謝謝你的留言,歡迎常常留下意見或討論。
記得回到部落格首頁看更多文章!