網路爬蟲抓取公開及非公開資料之著作權與個資法問題

專業法律分析 · 資料來源:法律圈 LawChain

案件內容與法律分析

一、問題/事實整理(LawChain 原文

當事人為工程師,撰寫了一套網路爬蟲程式,可自動抓取網路新聞、PTT論壇、社群平台公開社團與非公開社團以及其他社群媒體之貼文資料。當事人表示該爬蟲程式係用於非商業用途(如個人研究或資料分析),欲了解此類行為在著作權法、個人資料保護法及其他法規上是否構成侵權。

資料來源:法律圈 LawChain

二、爭點
  • 網路爬蟲自動抓取網站內容是否構成著作權法上之「重製」行為?
  • 抓取公開資料與非公開資料(如非公開社團)在法律上之差異為何?
  • 非商業用途是否得主張著作權法上之合理使用?其判斷標準為何?
  • 爬蟲抓取含有個人資料之內容,是否違反個人資料保護法?
  • 繞過存取限制抓取非公開資料,是否構成刑法妨害電腦使用罪?
三、相關法條
四、法律分析

爬蟲抓取網站內容構成著作權法上之重製行為。本案當事人以自行撰寫之網路爬蟲程式抓取網路新聞、PTT論壇及社群平台之貼文資料。就著作權法而言,爬蟲抓取網站內容之過程涉及將他人著作儲存於本地端,構成著作權法第3條第1項第5款所定義之「重製」。網路新聞報導、PTT文章、社群貼文等,只要具備原創性,均屬受著作權保護之語文著作。縱使當事人主張為非商業用途之個人研究,亦非當然得豁免於著作權之規範。依著作權法第65條第2項之四項基準判斷,若爬蟲係大量全文抓取而非僅摘錄部分內容,在「利用之質量及其在整個著作所占之比例」及「利用結果對著作潛在市場之影響」兩項基準上較難成立合理使用。依著作權法第52條之研究引用,亦僅限於合理範圍內之引用,不包括大量全文複製。

抓取非公開社團資料涉及刑法妨害電腦使用罪。就非公開資料(如非公開社團)之抓取,法律風險顯著升高。非公開社團之內容係設有存取限制,僅限加入成員可閱覽。若爬蟲程式繞過此等存取控制機制以取得資料,可能構成刑法第358條之無故入侵電腦罪(三年以下有期徒刑)或第359條之無故取得電磁紀錄罪(五年以下有期徒刑)。即便當事人係該社團之成員,若其以自動化程式大量擷取超出正常瀏覽範圍之資料,仍可能違反平台之服務條款構成民事上之違約責任,甚至在某些情況下被認定為超越授權範圍而符合「無故」之要件。

爬蟲抓取含個人資料之內容涉及個資法。爬蟲抓取之資料若包含可識別特定自然人之資訊(如帳號名稱、頭像、發文內容、個人經歷等),即涉及個人資料之蒐集與處理。依個資法第19條第1項規定,非公務機關蒐集個資須符合特定目的且有法定事由。單純之個人研究用途是否符合個資法之豁免,仍需視具體情況判斷——若研究成果擬公開發表,更須確保已符合個資法第20條利用個資之規定。違反者依個資法第41條可能面臨刑事責任。

降低法律風險之具體技術與法律建議。綜合以上分析,當事人之爬蟲行為涉及著作權法、刑法及個資法之多重法律風險。建議當事人採取以下措施降低風險:優先抓取公開且無存取限制之資料,嚴格遵守各網站之robots.txt檔案規範;詳閱各平台之服務條款確認是否允許自動化工具存取;抓取資料時採取去識別化處理移除可識別個人身分之資訊;避免全文大量複製儲存他人著作,改以摘要、統計或分析結果之形式利用;絕對不繞過任何存取控制或認證機制以抓取非公開資料。

五、結論與建議

結論:網路爬蟲抓取資料涉及著作權法、個人資料保護法及刑法等多重法律風險。公開資料之抓取在符合合理使用條件下可能較有正當性,但非公開資料之抓取風險極高。非商業用途並非侵權之絕對免責事由。

  1. 優先抓取公開且無存取限制之資料,避免繞過任何存取控制或認證機制。
  2. 遵守各網站之robots.txt檔案規範,不抓取被禁止爬取之頁面或資料。
  3. 詳閱各平台之服務條款,確認是否允許自動化工具存取及資料抓取。
  4. 抓取資料時採取去識別化處理,移除或匿名化可識別個人身分之資訊。
  5. 避免全文大量複製儲存他人著作,改以摘要、統計或分析結果之形式利用。
  6. 若研究成果擬發表或分享,應確保引用方式符合著作權法第52條及第65條之合理使用要件。
  7. 建議於開始大規模爬蟲作業前,諮詢智慧財產權律師,評估具體方案之法律風險。
免責聲明

以上內容由律果AI法律助理協助本所律師依台灣法規與實務見解整理,本所擁有著作權。相關內容僅供參考,不構成正式法律意見,具體案件請進一步諮詢本所律師。本站資訊如有錯誤或過時,請以主管機關最新公告為準。

上一頁 下一頁
返回 FAQ 列表 聯絡律師團隊
加LINE 免費法律諮詢