癮科技(Engadget) 新網站涉嫌竊取本站plurktop資料,請你們出來面對

轉換為簡體

這太誇張了。你們做這樣的事不會臉紅嗎?

昨天晚上,我無意中發現這個網站,叫做 pp.cool3c.com,網域在癮科技底下,但內容跟我之前做過的plurktop功能幾乎一模一樣,只不過外觀重新組合了一遍,叫做噗熱浪

這個網站,每則熱門新聞底下有兩篇討論、有轉噗按鈕外掛、有噗浪機器人,幾乎都是plurktop有的功能,只是版面配置不太一樣。

(這是plurktop手機版頁面,可以看到有網友留言;

而plurktop的轉噗按鈕就在本文右上角,轉噗機器人在這裡

本來,我以為,這只是個英雄所見略同的狀況--癮科技覺得這個東西不錯,想自己拿來做,那也很好,反正plurk的API就已經公布在網路上,任何人都可以用它來開發--

但是,我錯了。癮科技這個網站,一天存取plurktop數百次,很明顯後台是接plurktop的水管做的。

請看證據:這是plurktop後台的存取記錄。

76.74.155.106 – - [03/Apr/2010:00:00:01 +0800] “GET /replurkdetail?link=4c3dfe84487cf56b91d59a1677a6ea87 HTTP/1.0″ 200 38944 “-” “-”
76.74.155.106 – - [03/Apr/2010:00:09:44 +0800] “GET /replurkdetail?link=e4a9e1b19dea9e6220163258a459f9a4 HTTP/1.0″ 200 36052 “-” “-”
76.74.155.106 - – [03/Apr/2010:00:09:45 +0800] “GET /replurkdetail?link=2f56a54fa7f40f32a1ae3a1f2a489c24 HTTP/1.0″ 200 40282 “-” “-”
76.74.155.106 – - [03/Apr/2010:00:09:46 +0800] “GET /replurkdetail?link=85eb1c6170ec0abf9e12084cb6dd3da7 HTTP/1.0″ 200 91481 “-” “-”
76.74.155.106 – - [03/Apr/2010:00:09:47 +0800] “GET /replurkdetail?link=10968a504bd6163ba095bf3d49299240 HTTP/1.0″ 200 32106 “-” “-”
76.74.155.106 – - [03/Apr/2010:00:09:48 +0800] “GET /replurkdetail?link=0bdfb09310d38380b3eb1ef19dd8794e HTTP/1.0″ 200 49791 “-” “-”
76.74.155.106 – - [03/Apr/2010:00:09:49 +0800] “GET /replurkdetail?link=21a0546fa78c5a94067273957e8e526f HTTP/1.0″ 200 81288 “-” “-”
76.74.155.106 – - [03/Apr/2010:00:09:50 +0800] “GET /replurkdetail?link=b76c2cf91715da73007e05eefc2d7620 HTTP/1.0″ 200 43629 “-” “-”
76.74.155.106 – - [03/Apr/2010:00:35:44 +0800] “GET /replurkdetail?link=8ecf3368506207e0535e7616d8f9497e HTTP/1.0″ 200 30529 “-” “-”
76.74.155.106 – - [03/Apr/2010:00:35:46 +0800] “GET /replurkdetail?link=7eca33a083da5ba645a77a757ae8732a HTTP/1.0″ 200 46160 “-” “-”
76.74.155.106 – - [03/Apr/2010:00:35:48 +0800] “GET /replurkdetail?link=f764aeae0498b90bad2a503f2bed3e17 HTTP/1.0″ 200 48368 “-” “-”
76.74.155.106 – - [03/Apr/2010:00:35:49 +0800] “GET /replurkdetail?link=56ec35697760c9418030bac095460c84 HTTP/1.0″ 200 46506 “-” “-”
76.74.155.106 – - [03/Apr/2010:00:35:51 +0800] “GET /replurkdetail?link=18b4100bb530cee434cfe1bbc3d15885 HTTP/1.0″ 200 25409 “-” “-”

有一個來自 76.74.155.106的IP,從三個星期前開始,幾乎定期上來撈Plurktop的頁面,幾乎一秒鐘一頁(哪個人看網頁這麼快?)有時一天只撈30次,有時一天撈200次,前後下來已經撈了七千多次。

更誇張的是,這個76.74.155.106的IP是哪裡?

竟然就是癮科技的新網站:pp.cool3c.com !

我真不敢相信我的眼睛,原來現在一個新網站這麼好做,後台資料只要接別人的網站…而且,還不是做Mashup新應用喔,是個功能一模一樣的網站!

然後,事還沒完。

我們繼續把這個ip一路trace下去…更令人驚訝的是,這個主機名字?

這個主機叫做 door2.urs.tw ,domain name一看就知道跟部落格觀察有關係。的確,在噗熱浪的右上角,的確也有著噗熱浪 powered by PLURK2的字樣。

我真是沒想到。Plurktop是我跟Wednesday一年半以前的side project,當初只是練習程式所以有很多缺陷,所以我們後來也重刻一個新的網路新聞觀察網站Newspeak,現在重心都在這裡了。是的,plurktop我們已經很久沒有加新功能了…但是,這些程式碼,都是我跟Wednesday兩個人寫的,要放任別站偷接水管,這種事我們做不到。

所以,癮科技,我們的要求如下:

  1. pp.cool3c.com立刻停止從plurktop撈資料
  2. 在 engadget blog 上面立刻公開道歉,道歉文必須是置頂文三天,並公布事情經過,說明是誰做出這樣的事情

我們素來很尊敬你們,我們也不希望撕破臉,希望你們好好面對。

過去的今天:

相關推薦


訂閱到抓蝦 分享

  • 奉勸各位在真相尚未明確之前,千萬不要先下評論,以免一時的情緒,惹來毀謗名譽之罪
  • 您好,關於貴站此篇文章
    噗熱浪已發表聲明如下:
    http://pp.cool3c.com/index.php?type=event20100823

    關於竊取資料的指陳是不正確的
    噗熱浪並沒有進行所謂「接水管」的動作
    請站方明察,並提出更正聲明,此事影響甚大
    還請正視
  • Lavik
    以我粗浅的文字能力来看,弱弱的说一句.....既是"涉嫌"..就表示无法"定罪"....那么要求也就"无谓"了...
  • 小梅子
    我覺得問題在於經營者和技術者的認知差別,技術者覺得資料是研究用的,有使用比例原則的自由心證,但經營者可能會覺得只要是有抓取就不應該 ...
  • 搬沙發
  • Aqqnicole
    癮科技是個大公司
    MMdays只是幾個學校好友組成的共筆網站
    先不論空間跟開發都需要錢與時間

    但在道德邊緣遊走,把自己的行為公眾化合理化
    一些道德邊緣的人,也出來幫腔

    就像辦公室老闆背後摸你一下,你若出來討個正義
    肇事者說這是天下男人都會犯的錯,一堆人出來幫腔說:這又沒什麼,又不犯法
  • Evilmask
    http://geneoralspeaking.blogspot.com/2010/08/bl...

    plurktop也摸了人家黑貘屁股一下,怎也不見出來道歉
  • 好手
    若您是網路人,相信您會有不同的認知
    就像總統一定要被說得很無能、立委一定要很會炮一樣
    這是不是人為刻意操弄,這是「宿命」
  • Shunyuan
    支持您喔,希望有個完滿的結局。
  • Blsadaspam
    反應真的太大了,以後你的網站就寫任何機器人都不能抓取就好了啊!
  • 或許可以在robot.txt 看看怎麼標注(不給這類程式或是搜尋引擎抓取資訊) , 不過也有很多搜尋引擎是不管這個的
  • Waholayo
    我想,Friday的重點不是在於資料本身,而是資料的取得方法(接水管):主機資源和頻寬都是要花錢的。

    最新回應:http://geneoralspeaking.blogspot.com/2010/08/blog-post_22.html
    到此討論該會告一段落了吧?(茶)
  • soft4fun
    接水管取資料的案例比比皆是,同樣是網路人,相信MMDays應該也做過不少這樣的事情

    但是通常我們並不會去要求接我們水管的人關站或道歉,畢竟是他們自己要把東西公開在網路上,且內容的所有權也不屬於他們........
  • Waholayo
    同意你的說法。依愚之見,這算不上竊取資料,也不是抄襲網站,頂多是「未註明資料來源」,而且又算是同業競爭。(題外話,黑貘的好像業比較重,容易出事……)
    只不過流言越傳越謬,忍不住寫了幾句。

    說實話,我原本是被「殺人標題」給吸引近來的鄉民,想要看場PK大戰的(懺)。
    既然原告和被告都已現身說法,那我也不需要充當判官來評個公理。

    從雙方公布的技術細節來看,這原本應該是私下溝通就能解決的。
    事行至此,只求能看到個圓滿的結局,不要不了了之啊(茶)。
  • Erian.S
    要要求第一點
    一開始是寫"1. pp.cool3c.com立刻關站"
    事後修改要不要註明一下呢?
  • 我沒惡意,不過; http://www.plurk.com/p/73gmhi 這給你參考
  • 好手
    感覺反應有點大了些...
    網路上有數不清的網站是藉由擷取其他網站的資訊,並且重新匯集成自身網站上的內容
    只要他擷取的內容並不屬於你,你也就無權主張他擷取這些"內容"
    如果不希望第三者從您的網站上擷取您所彙整的資料,那就阻擋他吧!

    Yahoo 新聞、股市、網拍每天有多少人在砍站? Yahoo 也只是針對太誇張的 USER 送出 999 ERROR
    從沒看過YAHOO要求對方停止擷取資料或道歉的行為

    總歸一句,網路是共產世界,不想分享財產,那麼就自己限制吧!
  • 我也認同這樣的反應太大了。
    畢竟也沒有強制規定資料不能使用,就掛上『涉嫌竊取』的名義。
    有點不太恰當。
  • Yellowbird
    太誇張了,癮科技這麼出名還敢這樣幹啊。
  • 大家多噗一點,看他自己噗熱浪上面出現這篇文章時會做何感想XD
  • PowerOp
    癮科技改名 引 科技不就得了 XD
  • Cell_ghost
    引用要著名出處,乾脆改名剽科技好了。...剽要唸四聲喔!XD
  • 沒錯,封掉就可以。抄襲要承受風險的。
  • albert
    直接擋掉他們 IP 就行了
    另外,我想他們應該不會道歉,又沒犯法 (茶)
  • Jimmy
    我有個問題,這樣掃資料真的很大量、很多筆,沒有被自動檔掉?我每天都被yahoo和google砍到暴,1天絕對超過2000筆,都得做限制來自動偵測連線數和砍站行為了... 如果超過一定量,應該早就被歸類為砍站行為,既然沒超過,那就還好吧?

    如果真要幹資料偷偷抄襲,絕對會找動態的ADSL... 不會讓人抓包的啊.. @@
blog comments powered by Disqus