日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > > 充電吧
[導讀]記者消息,7 月 1 日,Google 在其博客上發(fā)布了一個重要消息,它宣布,Google 開源了存儲 robots.text 解析器的 C++ 庫,以便推動 REP(Robots Exclusion



記者消息,7 月 1 日,Google 在其博客上發(fā)布了一個重要消息,它宣布,Google 開源了存儲 robots.text 解析器的 C++ 庫,以便推動 REP(Robots Exclusion Protocol,也稱爬蟲協(xié)議、機器人協(xié)議)成為互聯(lián)網(wǎng)標準。

1994 年,荷蘭軟件工程師 Martijin Koster 提出了 REP 的概念,通過 robots.txt 文件來隱藏一些信息不被搜索引擎抓取,比如,只抓取應該被抓取的頁面;屏蔽一些網(wǎng)站中較大的文件;屏蔽一些無效鏈接;保密敏感信息等。

記者注:搜索引擎的爬取方式(圖片來自百度百科)

我們可以這么來理解,網(wǎng)站就好比一個房間,robots.txt 文件就是主人在房門上懸掛的“請勿打擾”的提示牌,可以讓人止步于一些存放貴重物品的房間,但它終究不是守門人,無法阻擋懷有惡意的竊賊。

聯(lián)合多方力量上交提案

25 年過去了,業(yè)內(nèi)對 REP 表示了充分的認可,但現(xiàn)在它更像是一個道德規(guī)范,而不是非官方的互聯(lián)網(wǎng)標準。

不過,Google 正致力于改變這一現(xiàn)狀。Google 在博客中說道,

我們希望幫助網(wǎng)站所有者和開發(fā)者在互聯(lián)網(wǎng)上創(chuàng)造令人驚嘆的體驗,而不是擔心如何控制抓取工具。Google 和協(xié)議的發(fā)起人,以及其他網(wǎng)絡管理員和搜索引擎共同起草了一份關于如何在現(xiàn)代網(wǎng)絡上適用 REP的提案,目前已經(jīng)上交給了 IETF(記者按:Internet Engineering Task Force,非盈利互聯(lián)網(wǎng)開放標準組織,負責開發(fā)和推廣自愿互聯(lián)網(wǎng)標準)。

Google 的提案反映了 20 多年來 Googlebot 和一些主要網(wǎng)絡爬蟲,以及大約 5 億依賴 REP 的網(wǎng)站應用 robots.txt 的實際經(jīng)驗,并且在現(xiàn)代網(wǎng)絡層面做了擴展,定義了 robots.txt 解析和匹配的所有之前未定義場景:

任何基于 URI 的傳輸協(xié)議都可以使用 robots.txt;它不再局限于 HTTP,也可用于 FTP 或 CoAP。

開發(fā)人員必須至少解析 robots.txt 的前 500 KB 內(nèi)容。定義文件的最大值,以確保打開連接不需要花太長時間,從而減輕服務器上不必要的壓力。

新的最長緩存時間為 24 小時或可用的緩存指令值,賦予網(wǎng)站所有者靈活性隨時更新 robots.txt,而爬蟲程序不會因此使網(wǎng)站過載。

當前可以訪問的 robots.txt 文件由于服務器故障而變得不可訪問時,這些無法訪問的頁面將在很長一段時間內(nèi)不被檢索。

開源 robots.txt 解析器

除了聯(lián)合多方力量向 IETF 上交提案,Google 還作出了其它努力,開源了自己 robots.txt 文件庫旨在創(chuàng)建標準化語法來創(chuàng)建和解析文件,消除所有混淆。

Google 在博客中這樣說道:

REP 是網(wǎng)絡中最基本,最關鍵的組成部分之一,但它只是約定俗成的標準,這難免讓人感到沮喪;這給網(wǎng)絡管理員和爬蟲工具開發(fā)者帶了困擾......推動 REP 成為行業(yè)標準這件事十分重要,因為它符合每個人的利益。不過,對于解析 robots.txt 文件的開發(fā)人員來說,這種標準化需要付出更大的努力,所以,我們開源了含有 robots.txt 解析器的 C++ 庫。

據(jù)稱,這個 C++ 庫已經(jīng)存在了 20 年之久,里面包含了自 90 年代起就編寫的代碼片段。在這 20 年里,該庫經(jīng)歷了不斷的發(fā)展,也覆蓋了許多在編寫 robots.txt 文件方面非常實用的案例,這對想要構(gòu)建自己的解析器的開發(fā)人員來說很有助益。

除此之外,Google 還在開源軟件包中添加了一個測試工具,可以幫助編寫人員測試 robots.txt 的效果。

外界的態(tài)度

在 Google 開源 robots.txt 后,這個話題引起了廣泛的關注,甚至登頂 Hacker News。

Constellation 研究公司(記者(公眾號:記者)按: 專門從事數(shù)字化轉(zhuǎn)型和顛覆性技術方面的技術研究與咨詢)的分析師 Holger Mueller 告訴 SiliconANGLE,標準化對于互聯(lián)網(wǎng)正常工作至關重要,很高興看到 Google ?在 REP 這樣基本的東西上取得領先。

Holger Mueller 還補充道,

與任何開源倡議和標準化嘗試一樣,我們還需要靜待,看看此舉到底會不會成功,我們又能在此之中學到什么。這是一個值得密切關注的領域。

在國內(nèi),網(wǎng)友們也紛紛高呼“谷人希”(記者按:“谷歌,人類的希望”)來表示對該事件的贊賞。


本站聲明: 本文章由作者或相關機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: 驅(qū)動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設備,其驅(qū)動電源的性能直接關系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅(qū)動電源設計中至關重要的兩個環(huán)節(jié),集成化方案的設計成為提升電機驅(qū)動性能的關鍵。

關鍵字: 工業(yè)電機 驅(qū)動電源

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設備的使用壽命。然而,在實際應用中,LED 驅(qū)動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設計、生...

關鍵字: 驅(qū)動電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關鍵字: LED 設計 驅(qū)動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術之一是電機驅(qū)動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅(qū)動系統(tǒng)中的關鍵元件,其性能直接影響到電動汽車的動力性能和...

關鍵字: 電動汽車 新能源 驅(qū)動電源

在現(xiàn)代城市建設中,街道及停車場照明作為基礎設施的重要組成部分,其質(zhì)量和效率直接關系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關鍵字: 發(fā)光二極管 驅(qū)動電源 LED

LED通用照明設計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關鍵字: LED 驅(qū)動電源 功率因數(shù)校正

在LED照明技術日益普及的今天,LED驅(qū)動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關鍵字: LED照明技術 電磁干擾 驅(qū)動電源

開關電源具有效率高的特性,而且開關電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅(qū)動電源

關鍵字: LED 驅(qū)動電源 開關電源

LED驅(qū)動電源是把電源供應轉(zhuǎn)換為特定的電壓電流以驅(qū)動LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: LED 隧道燈 驅(qū)動電源
關閉