
當我們想要搜索某些內(nèi)容時,我們第一個想到的就是打開Google、百度或必應(yīng)這類的搜索引擎。但針對有些內(nèi)容,卻是這些常規(guī)搜索引擎無法獲取到的,那就是隱藏在深網(wǎng)的內(nèi)容。據(jù)不完全統(tǒng)計,深網(wǎng)的信息量為表層網(wǎng)絡(luò)的500倍。那么,深網(wǎng)主要都包含了些什么內(nèi)容呢?其實,深網(wǎng)主要包括的都是些,例如需要某些條件如注冊、付費,才能訪問的內(nèi)容,如數(shù)據(jù)庫和某些服務(wù)等。而常規(guī)搜索引擎通常只會對靜態(tài)網(wǎng)頁進行抓取,而對于這些存儲在數(shù)據(jù)庫中的內(nèi)容,對其而言幾乎是不可見的。其次,當我們使用Google時,Google還可能對我們的活動軌跡進行跟蹤。這對于要求匿名的用戶而言,也是不可接受的。
為什么Google搜索不到深網(wǎng)的內(nèi)容?
這是因為所有的Deb網(wǎng)站(.onion)都是沒有索引的,而正常的搜索引擎通常都是通過目標網(wǎng)頁索引來獲取內(nèi)容的。因此對于沒有索引的搜索結(jié)果則不會被Google所收錄。此外,在搜索過程中還會和服務(wù)器建立連接,這樣對我們的隱私和安全也帶來了一定的隱患。
“據(jù)研究人員介紹,只有4%的互聯(lián)網(wǎng)對公眾可見,剩下的96%的網(wǎng)站和數(shù)據(jù)則隱藏在Deep web。”
此外,深網(wǎng)中還包含了許多非法內(nèi)容,例如毒品,武器交易,高度成熟的黑客工具,色情,軍事機密等。
robots文件
robots.txt是搜索引擎中訪問網(wǎng)站的時候要查看的第一個文件。robots.txt文件會告訴蜘蛛程序,在服務(wù)器上什么文件是可以被查看/禁止查看的。如果某些頁面被設(shè)為不可查看,那么搜索引擎也是無法正常獲取到的。
說了這么多,那么有沒有既可以保證高度匿名性,又可以獲取到深網(wǎng)內(nèi)容的搜索引擎呢?下面,我將為大家推薦十款比Google,必應(yīng)更加“強大”搜索引擎:
1. pipl

Pipl是一款為搜索網(wǎng)絡(luò)上的人物信息而生的搜索引擎。不同于傳統(tǒng)意義上的搜索引擎,Pipl是專為檢索“深網(wǎng)”上的信息而設(shè)計的。Pipl的爬蟲能夠與可搜索的數(shù)據(jù)庫打交道,從中提取個人信息、聯(lián)系方式、成員名錄、科學(xué)出版物、法院記錄以及其它很多“深網(wǎng)”內(nèi)容。
Pipl目前提供五種方式搜索方式搜索特定人物:名字、Email地址、用戶名、電話號碼以及還處于BETA版的商業(yè)搜索。
Pipl所關(guān)注的不僅僅是找到更多的結(jié)果,它還通過高級語言分析和排名算法將與你搜索關(guān)鍵詞最相關(guān)最匹配的結(jié)果以簡單的單頁形式展示給你。
2. My Life

MyLife是一個全面的成年人資料數(shù)據(jù)庫,可以根據(jù)姓名、年齡、郵編等信息來查詢你想要找的人。
MyLife的服務(wù)可以通過整合Twitter、Facebook、LinkedIn、Friendster和Flickr等社交網(wǎng)站的數(shù)據(jù),幫助用戶在互聯(lián)網(wǎng)上找人。MyLife用戶是免費注冊,但如果要使用單身搜索、查看誰在搜索自己等高級功能,用戶就需要付費。
MYLIFE網(wǎng)站還推出了一個全新的個人關(guān)系管理系統(tǒng)(PRM),是一個基于瀏覽器的服務(wù),讓用戶在同一個內(nèi)容流里就能看到Facebook、Twitter和LinkedIn的訂閱源并進行答復(fù)、“贊”、轉(zhuǎn)推等操作。
3. Yippy

Yippy是一個將多個搜索引擎信息結(jié)合在一起,然后得出統(tǒng)計結(jié)果的集成化搜索引擎。如果你想檢索暗網(wǎng)的信息,Yippy便是一個不錯的工具。暗網(wǎng)因其存儲在專用網(wǎng)絡(luò)而被屏蔽難以發(fā)現(xiàn),而Yippy提供的搜索結(jié)果將幫助你發(fā)現(xiàn)不被傳統(tǒng)搜索引擎檢索到的隱藏網(wǎng)站。
4. Surfwax

SurfWax是一個元搜索引擎,能限定最多返回結(jié)果條數(shù)和排序方法,檢索速度一般。該搜索引擎有一個顯著特點,即點擊每條結(jié)果左邊的“網(wǎng)址按鈕”圖標,可瀏覽該結(jié)果包括的任何頁面,并顯示搜索語句在文件中的位置。可以把搜索結(jié)果和文件存儲起來以備后用。此外,焦點字(FocusWords)功能提供搜索詞在各種不同含義下的同義詞/近義詞、上位詞、下位詞的列表,輔助選擇詞語檢索。
5. Way Back Machine

通過Wayback Machine可以搜索某一特定網(wǎng)站過去(從1996年到現(xiàn)在)的樣子。實現(xiàn)對Web過去的存檔要求一百太字節(jié)的存儲空間,并包含一百億個網(wǎng)頁!網(wǎng)頁存檔起初是由Alexa項目的負責(zé)人收集的。你可以在你的電腦上安裝一個提供網(wǎng)站信息和排名的工具欄。
在Wayback Machine網(wǎng)站上,你可以搜索和鏈接你喜歡的網(wǎng)站,看它們過去的樣子,你會發(fā)現(xiàn)它們像時間“快照”一樣保存著。例如,你可以看到whatis.com網(wǎng)站在1996年的樣子,也可以看見它在1997年及以后的樣子。
6. Google Scholar

GoogleScholar學(xué)術(shù)搜索專門在期刊論文、理論摘要及其他學(xué)術(shù)著作文獻中進行搜索,內(nèi)容從醫(yī)學(xué)、物理學(xué)到經(jīng)濟學(xué)、計算機科學(xué)等等,橫跨多個學(xué)術(shù)領(lǐng)域以及大量書籍和整個網(wǎng)絡(luò)中的學(xué)術(shù)性的文章。它雖然不支持中文,但可以用拼音搜索國內(nèi)學(xué)者在國際刊物上發(fā)表的文章。這個搜索引擎搜索國外的資料非常方便,輸入一個學(xué)者的名字,就可以搜索出其全部在網(wǎng)上的文章,并且可以知道在哪個數(shù)據(jù)庫,以及該篇文章被多少篇其它文章所引用,以及所引用文章的目錄等等。同時該學(xué)者所著的書也都有顯示,并告知該書被哪些圖書館所收藏,或其它可能獲得的商業(yè)途徑。GoogleScholar的搜索結(jié)果可以過濾掉普通搜索結(jié)果中的大量垃圾信息,排列出文章的不同版本以及被其他文章所引用的次數(shù),還可以通過引用鏈接方便的找到與搜索結(jié)果關(guān)聯(lián)的其它相關(guān)學(xué)術(shù)資料,對于學(xué)生、學(xué)者以及其他需要經(jīng)常查閱學(xué)術(shù)文章的人來說是非常實用的。
7. DuckDuckgo

害怕信息被泄露,想要匿名訪問互聯(lián)網(wǎng)?DuckDuckGo將是你的首選!DuckDuckGo不會保存你的任何瀏覽信息、社交文件、郵件等,這也是跟Google最大的區(qū)別。DuckDuckGo的用戶非常喜歡像「zero-click」這樣的功能,快速無線下拉設(shè)計真的是懶人福利。更棒的是,DuckDuckGo并沒有像Google那么多廣告,以及經(jīng)常彈出廣告等問題。DuckDuckGo甚至還配備了自己的Tor出口中繼,幫助Tor用戶提高搜索性能。
8. Fazzle

Fazzle是一個支持英文發(fā)文和荷蘭文的元搜索引擎。它即可進行一般的網(wǎng)址搜索,又有一個主題目錄可提供專題的資源搜索。其前身為SearchOnline著名元搜索引擎。
9. not Evil

不像其他的Tor搜索引擎,not Evil是一個不以營利為目的的搜索引擎。它是專門設(shè)計用于搜索暗網(wǎng)內(nèi)容的搜索引擎,堪稱暗網(wǎng)中的谷歌。此外,它的安全性體驗度也做的非常的到位。既沒有多余的廣告推送,也不會對用戶的搜索行為進行跟蹤。再加上其不斷更新的搜索算法,用戶很容易就能通過它找到想要的內(nèi)容或信息。值得一提的是,在此之前該項目被人們廣泛的稱為TorSearch。
10. Start Page

StartPage是由Ixquick推出的一個托管在美國和荷蘭的搜索引擎服務(wù),通過免費匿名代理提供谷歌搜索和圖片搜索結(jié)果,號稱是世界上最安全的保密型搜索引擎。該搜索引擎非常注重把對用戶隱私的保護,它不會收集和分享任何用戶的資料。
在Startpage,Ixquick的隱私與谷歌的搜索結(jié)果緊密相連。你可以放心使用這些來自世界上最受歡迎的搜索引擎搜索的結(jié)果,并受到Ixquick的隱私保護,這是世界上最大的私有搜索引擎。并且還受到了第三方權(quán)威機構(gòu)——歐洲的聯(lián)盟隱私倡議機構(gòu)EuroPriSe的認證。 2008年7月14日,Ixquick被授予第一個歐洲隱私認證。
|