維基百科:Google搜尋和數量

維基百科,自由的百科全書
在谷歌上搜索字母「a」產生了超過120億次的連結。但這並不能決定字母「a」的關注度,讓編者單獨為它寫一個維基條目

谷歌搜尋及其搜索結果可以幫助判斷一個物品是否符合關注度指引.  

判斷一個主題的關注度指引是決定一個主題是否應該有關於自己的維基百科文章的一部分。其中最大的謬誤之一,就是認為僅靠谷歌搜尋的結果就可以用來評估關注度。利用文章或主題的標題或關鍵詞進行谷歌搜尋,就成了所謂的「谷歌測試」。人們可能很容易的認為,僅僅因為谷歌搜尋產生了大量的點擊量,就認為一個主題是值得注意的,或者因為搜索產生的點擊量很少而不值得注意,或者因為根本沒有產生任何點擊量而認為是騙局。雖然這樣的搜索確實是一個非常有用的起點,但它們本身並不能決定是否符合關注度指引。

一個晦澀難懂的17年代的哲學理論,在許多廣受推崇的老書中都有引用,但在谷歌搜尋中可能不會出現。但是,沒有Google點擊率並不意味着這個理論不引人注目,也不意味着這個理論就是個騙局。事實上,根據維基百科的方針,這個理論可能是值得注意的,因為它在多個可靠來源中都有描述。另一方面,一個真人騷選手的名字可能會產生成千上萬的Google點擊率——粉絲聊天頁面和博客文章中關於他或她的性生活的內容——但這些都不是可靠的來源

在進行普通的網絡搜索時,有可能會出現大量的點擊量。最有可能的是,其中大部分都不能算作可靠的來源。Google NewsGoogle BooksGoogle Scholar提供的結果更有可能是可靠的來源,但前提是這些點擊率能夠得到驗證,並且通過閱讀文章或書籍,確認這些點擊率都是可靠來源。雖然所有這些可能都不能在Google網站本身就能看到,而且很多都是預覽,但搜索至少可以顯示出這些來源的存在。

搜索結果

幾乎所有使用電腦或手機的人都會在某些時候使用搜尋引擎甚至是全平台搜尋引擎。有很多種搜尋引擎,如BingYahoo搜索,以及最受歡迎的Google搜尋,每天估計產生54億次的搜索請求。[1]Google使用算法根據個人偏好調整搜尋引擎結果頁(SERP)[2] ,除非關閉個人搜索標準,否則每個人的搜索結果不會產生原始結果,而是根據用戶的偏好產生特定的結果。

谷歌搜尋引擎

除了上面列出的谷歌搜尋平台(Google News、Google Books和Google Scholar)之外,還有Google Trends英語Google TrendsGoogle Maps Pack英語Local search (Internet)(谷歌本地三包業務列表)和Google Arts & Culture項目。

為什麼Google的結果會產生誤導?

為什麼僅僅使用谷歌搜尋的數字可能會對關注度的判斷產生誤導(「有204,00個搜索結果」)有各種各樣的原因。原始搜索結果的數字往往會被誇大,並且結果輸出包含許多變量,從而產生大量的點擊率。

雖然維基百科努力向世界免費提供知識,但谷歌並沒有遵循公益性的商業原則,而是依賴廣告。2014年穀歌數據庫規模估計為10 EB(1 EB=10億GB),現在很可能遠遠超過了2019年估計的615億網頁[3]左右的規模,2013年每天創造估計2.5萬億字節[4]的數據,這個數字現在很可能已經遠遠被低估。

廣告

幾乎所有的谷歌搜尋結果都遵循一個主題,那就是廣告。2017年,谷歌的廣告業務帶來了1108億美元的收入[5],這要歸功於各種服務,如Adwords(作為拍賣系統的專有廣告服務)幾乎是谷歌所有的網絡屬性中的一部分。其也包括AdSense計劃、Ad Manager和Google Ad Manager 360等。許多企業的收入完全依賴廣告服務。通過Google Ads功能,企業通過競價選擇詞彙(關鍵詞)來讓自己的企業在搜索結果排序中排名靠前。「谷歌搜尋功能」主要分為內容類型和增強型兩種。影響企業排名的一個主要因素是搜尋引擎優化(SEO),大多數有網站的企業都會在一定程度上使用SEO。如果不通過個性化,那麼搜索結果就會因人而異,從而給出對於維基百科的錯誤搜索結果。

相關性

儘量減少大點擊率或「個性化搜索結果」的方法是在搜索查詢的結尾添加「&pws=0」[6]。這將「關閉」個性化搜索結果[7],如個人搜索歷史、習慣、當前地理位置等個性化因素。還有其他的URL修飾符也可以使用[8]

Google搜尋不是參考資料

在頁面存廢討論中,引用Google搜尋Google News搜索的結果,並且說:「看看所有的結果,有你的引用來源」或「Google點擊量兩千次,一定很顯著!」已經成為頁面存廢討論中的慣例。然而,Google提供了網上能找到的一切,其中絕大部分絕不是可靠的資料來源,Google News轉載了大篇幅的資料,這些資料不一定可靠,不一定與文章主題相關,也不一定與AFD關閉時還在那裏(注意,在網上找到的新聞文章,即使網站停刊,完整的引用,註明作者、標題、報社名稱等仍然有效。但是,一個光禿禿已經失效的網址可能會使網上的新聞源失去作用)

因此,如果使用Google找到的來源,與正在存廢討論的主題相關,很好!但要引用你找到的確切的參考文獻或來源,而不是對着Google搜尋的點擊率數字含糊其辭,這個龐大的數字證明這篇文章的主題是顯著的、可驗證的、值得爬上帝國大廈的。反之亦然:不要在AFDs中爭論「谷歌點擊率為零,一定是不顯著的」。

維基百科不是詞典

維基百科不是字典。詞典的重點是詞或短語,完全按照其標題進行論述,一般不會偏離這個標題。維基百科作為一部百科全書,其目的是講述一個人、群體、地點、對象、事件或概念。其中的任何一個或多個標題或詞組都可能被稱為「維基百科」,而且任何這樣的標題都可能有不止一種含義。雖然維基百科的每一篇文章都有一個標題,但不是標題定義主題,而是其中包含的信息定義主題。

像谷歌這樣的搜尋引擎關注的是單詞或短語,就像一個人可能會輸入的文章標題一樣。例如,如果一個人想了解關於油畫的信息,他/她可能會在搜尋引擎中輸入「油畫」這兩個詞(引號)。這很可能會產生大量出現「油畫」兩個字的網站。眾所周知,很多網站的點擊量都是關於油畫的。但查詢也可能會產生這樣的網站:「她在吃着橄欖油色拉,畫着樹的畫,聽着音樂。」這句話中連續出現「油、畫」這幾個字,因此,會在這樣的Google查詢中出現。但是,它與油畫沒有任何關係。

如果你在搜尋引擎中輸入「正在跑圈」這個短語,你會得到一些包含這些詞的點擊量,而這些詞恰恰是連續的。這個句子的片段可能會出現在一個網站上,上面寫着「他在當地的賽道上跑圈」。但這並不意味着應該有一篇題為「他在跑圈」的文章。

在谷歌上搜索「如果」這個常用詞,會產生幾十億的點擊量。在維基百科上,標題「if」並沒有定義「if」這個詞。相反,它導致的是一個消歧義的頁面英語if,顯示了一長串的主題,包括許多歌曲,碰巧被取名為「if」或首字母為IF。儘管如此,常見的if這個詞的含義還是被限制在詞典條目中,只能在WikiDictionary上見到。

許多術語有多種含義

許多單詞、短語和其他單詞的組合都有不止一個意思。例如,「4:30」這個詞對大多數人來說可以指時鐘上的時間,也可以指聖經中的經文。但用這兩個例子中的任何一個來寫文章,都不適合用這個確切的標題。4:30的標題是一部電影的名字。並非所有的Google搜尋4:30都會產生與這部電影相關的網站。儘管如此,4:30在維基百科上只是這部電影。

Astro Boy這個詞有很多用途。它主要是作為一部電視連續劇而聞名,但也有一個消歧義頁英語Astro Boy (disambiguation)列出了這個標題的其他用途。如果在Google上搜索這個詞],不清楚有多少個結果涉及到哪個意思。

不是所有的網站都是可靠的來源

谷歌搜尋可能會產生數百、數千、甚至數百萬的點擊率,而這些點擊率的確切標題是文章的標題,或者是由關鍵詞衍生出的其他網頁。但是,只有符合可靠來源的網站才能被用來使主題具有關注度並驗證信息的準確性。其他大多數網站都不符合外部連結添加標準,更不用說引用了。

許多網站,而且往往是大多數網站都沒有做到這一點。有許多網站的目的是為了銷售產品或服務。維基百科不是一個廣告空間,這樣的網站連結將違反維基百科的廣告政策。其他的網站包括博客自媒體維基百科的克隆,以及其他非中立或可驗證的信息來源。

要找到真正可靠的信息來源,最好的方法不是通過谷歌搜尋,而是通過谷歌新聞、書籍和學術搜索。即便如此,這並不意味着任何一個搜索結果數字都具有關注度,也不意味着在搜索中找到的所有信息源都是可靠的,無論對那篇文章還是對任何文章。儘管如此,符合標準的信息源還是比較容易找到。

不是所有的資料來源都能提供深入的報道

即使你確實找到了一個或多個按某種標準被認為是「可靠」的消息來源,但這並不自動意味着這些消息來源足夠好,可以支持某個主題。比如說,如果你想寫一篇關於某條街道的文章,你可能會發現很多瑣碎地提到那條街道的新聞文章,而這些文章很可能對編修其他主題很有幫助。當然,Googling一下就能找到這些文章。它們甚至可以幫助佐證另一個主題的關注度。但是,由於這些瑣碎的提及,它們並不能給這條街帶來關注度。

頁面存廢

頁面存廢討論中顯示文章值得保存的理由時,指出「點擊率」列表並沒有錯。如果尋找他人幫助打撈文章,這其實是個好主意,但僅憑Google搜尋結果並不能成為保留的理由。

三個最好的來源

比簡單地列出谷歌搜尋點擊率更好的方案是找到三個最好的來源英語WP:THREE,這三個來源都是可靠的,提供獨立深入英語WP:SIGCOV的報道。貼出這些或把他們添加到文章中。

列舉Google搜尋結果

看完之後,可能有人會認為,把谷歌搜尋的結果羅列在存廢討論中是一件壞事。其實完全不是這樣的。列出它們實際上可能有助於挽救一篇文章不被刪除。最好的做法可能是,將該搜索取消個性化或以原始搜索結果輸出。雖然Google的結果通常不會決定或打破這種情況,但它們可能會對其他人做出必要的改進,以挽救文章不被刪除,或者僅僅是同意去做應該做的事情。

提供Google結果列表的編者自己可能無法進行必要的改進。這樣做是不需要的。但是,其他人看到這些結果,可能就能解決這個問題,甚至提到這些更具體的來源,即使他們自己沒有添加來源(見WP:HASREFS英語WP:HASREFS)。

參見

參考資料

相關連結