《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 嵌入式技術(shù) > 業(yè)界動(dòng)態(tài) > 新型搜索引擎可搜索網(wǎng)站源代碼

新型搜索引擎可搜索網(wǎng)站源代碼

2014-10-15

從今天開始,設(shè)立在紐約的NerdyData服務(wù)器已經(jīng)顛覆了類似于谷歌這樣的傳統(tǒng)搜索引擎行業(yè)。NerdyData 使得企業(yè)家能夠搜索他們競(jìng)爭(zhēng)對(duì)手的源代碼而不只是搜索網(wǎng)站的內(nèi)容。


 

23歲的聯(lián)合創(chuàng)始人Steve Sonnes在今天下午的采訪中提到,“當(dāng)你從一個(gè)不同的角度去思考,你將發(fā)現(xiàn)我們可以用許多不同的方法去重構(gòu)搜索方式,NerdyData 就是專為搜索源代碼而推出的搜索引擎。”

Sonnes 認(rèn)為高效的搜索引擎專業(yè)人士可以使用 NerdyData 來(lái)檢查他們自己和競(jìng)爭(zhēng)對(duì)手的鏈接,從而創(chuàng)造正如他所稱的打造品牌權(quán)威的機(jī)會(huì);搜索 HTML 素材中的關(guān)鍵字,并且分析 CSS、Javascript 和 DOM 等一切可用來(lái)建立一個(gè)網(wǎng)站的資源。

企業(yè)家也能夠看到他們的競(jìng)爭(zhēng)對(duì)手使用的是哪一種部件,看到同一個(gè)谷歌分析賬戶名下的網(wǎng)站,哪些網(wǎng)站被某一團(tuán)隊(duì)貼上他們標(biāo)題標(biāo)簽,最終還能知道哪些網(wǎng)站使用某一特定顏色。

公司的網(wǎng)絡(luò)爬蟲已經(jīng)瀏覽過(guò)超過(guò)一億四千萬(wàn)的主頁(yè)并且收集了6.2萬(wàn)億字節(jié)的關(guān)于 HTML,Javascript和 CSS 的代碼。他們也設(shè)計(jì)了幾個(gè)網(wǎng)站接口允許使用者查詢網(wǎng)頁(yè)的源代碼或者在企業(yè)內(nèi)部下載包含具體條目的網(wǎng)站清單。


 

Sonnes 寫到,“我們甚至為引擎優(yōu)化和市場(chǎng)者提供專門的搜索接口,這些接口能夠?yàn)槟闼阉骶唧w的HTML 標(biāo)簽,類似于元數(shù)據(jù)描述和元關(guān)鍵字。”

雖然這個(gè)網(wǎng)站目前只完成了不到百分之一的工程量,但是他們并不想在發(fā)展的早期階段就揭示網(wǎng)站未來(lái)的特性。

Sonnes 和他的追隨者,23歲的共同創(chuàng)始人 David Bielik,他們也是剛從紐約的 Stony Brook 大學(xué)畢業(yè),在那里他們一見如故。在建立域名搜索引擎的同時(shí)他們創(chuàng)造了網(wǎng)絡(luò)爬蟲,如今網(wǎng)絡(luò)爬蟲被用于檢索和搜尋源代碼。

Sonnes 說(shuō):“沒(méi)有其他人在做這個(gè),所以我們要成為最好的,我們花了三個(gè)月的時(shí)間來(lái)構(gòu)造完整的 NerdyData 架構(gòu),今后我們會(huì)仍然努力工作盡我們最大的能力讓它逐漸走上正軌。”


 

沒(méi)有 NerdyData,對(duì)于在那些每天在網(wǎng)上點(diǎn)擊頁(yè)面詳情的瀏覽者而言,仍然要面對(duì)依舊存在的大量的舊信息,而 NerdyData 只是同時(shí)橫跨在數(shù)以百萬(wàn)計(jì)的網(wǎng)站上做這件事情而已。

一個(gè)基礎(chǔ)賬戶每個(gè)月可以搜索200次,并且每次查詢有10個(gè)結(jié)果是免費(fèi)的;一個(gè)專業(yè)賬戶每個(gè)月花費(fèi)99美元,并且可以進(jìn)行1200次搜索,每次搜索獲得高達(dá)5000個(gè)以上的結(jié)果,對(duì)于企業(yè)賬戶而言,每個(gè)月消費(fèi)149美元,每個(gè)月獲得超過(guò)3000次搜索,并且每次查詢可獲得1萬(wàn)個(gè)搜索結(jié)果。

Sonnes 和 Bielik 已經(jīng)帶領(lǐng)他們的公司走過(guò)了困難期,他們現(xiàn)在有五臺(tái)服務(wù)器,每臺(tái)服務(wù)器每月花費(fèi)是400美元。他們有600個(gè)使用者使用基本包,但只有不超過(guò)10個(gè)付費(fèi)使用者。

“這就是我們每個(gè)月的收入。”Sonnes自豪地說(shuō)。

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。