第16章 AI模型訓練(第2/2 頁)
最新都市言情小說:
畢業招聘,我選擇加入國安、
春風十里不如你嬌顏、
靈魂空間、
聽泉鑑寶:開局找聽泉拜把子、
天后為救親人,把我當工具人、
她們真的不是我女朋友、
藍星第一霸、
抗戰:我覺醒殺星系統、
修仙開局,先收十個老頭、
四合院:穿越51,四九城的生活、
一耳光過後,美女總裁愛上我、
加點都能成武神了,誰還苦練功法、
都重生了誰還戀愛腦!、
從殘破小院開始當創世神、
藍星武道,正太修仙、
政道問鼎、
都市反派:開局衝了氣運女主、
坐公交車遊遍全中國、
異世界哥哥、
全民:開局無敵,我組建億萬軍團、
王卿開始著手準備訓練自己的寫小說AI模型。
為了訓練這個模型,他需要一個足夠大的小說資料集。
“資料集,自然是在網上獲取。”
於是,他開始在各個小說網站上尋找可用的小說資料。
首先被他盯上的,自然是點娘小說網。
他開啟了網站首頁,看到了裡面的分類,點選進去,他發現了分類下有很多小說。
“這個分類下有不知道有多少本小說啊,要是一個個點進去再爬取,肯定會花費很多時間,還是寫一個爬蟲自動化一下吧!”王卿自言自語道。
於是他開始著手寫爬蟲,他開啟了自己的程式碼編輯器,開始寫起了程式碼。
他先寫了一個簡單的爬蟲程式,測試是否能夠爬取小說的標題和作者。
“先牛刀小試一下。”
資訊科技掌握五級,讓王卿看到現在的程式碼,感覺處處都是機會。
但是,未經過實踐過,他也不知道自己掌握的東西是不是井中月水中花。
還是要在電腦上跑一跑,心裡面才有底。
程式執行了幾分鐘後,王卿開啟了生成的資料檔案,看到了裡面的內容,沒有問題,數萬本小說的標題和作者都被寫入了資料庫之中。
本章未完,點選下一頁繼續。