摸魚新境界,用ChatGPT搞個機器人替自己幹活
大家好,我是東哥,你身邊放心的香港保險顧問。
這是我的第641篇原創。
上篇文章,我們探討了要不要介入當前大熱點小紅書,去分一杯流量的羹。
所有的賺錢,都是內行人賺外行人的錢。
把自己的長處,打磨成一米寬、一萬米深,形成絕對優勢。
然後用這個絕對優勢,給別人創造價值,進而在增量市場上,賺更高級的錢。
把自己的基本盤丟一邊,跑到別人的地盤上搶食,憑什麼?
梁靜茹也沒這麼大的勇氣。
今天我們繼續聊AI。
東哥這段時間,在ChatGPT的幫助下,做了一個機器人,讓它幹些數據收集的工作。
感覺很爽。
1
數據獲取傳統的方式是用爬蟲。
但實際上,爬蟲在現代網站上已經越來越不好用了。
一來是各網站的反爬系統非常強大。
爲了獲取一點數據,和專業的反爬工具和反爬團隊鬥智鬥勇,不值。
二來現代網頁有很多動態展示,傳統爬蟲沒有辦法處理這些問題。
怎麼辦?
換思路。
反爬工具是捕獲爬蟲特徵,如果我們不用爬蟲,而是模擬人的操作,大部分反爬工具就不好用了。
就是傳說中的機器人啊哈哈。
最簡單的,是用一些模擬鼠標鍵盤的工具,比如pyautogui。
這是什麼東東?
pyautogui是一個簡單、強大的 Python 庫,用於模擬鼠標和鍵盤操作。
常用於自動化任務、圖形化用戶界面測試以及一些簡單的腳本化工作。
簡單的來說,就是用Python控制鼠標和鍵盤,進而用代碼模擬人的操作。
比如可以移動鼠標到指定位置,點擊、雙擊、右鍵點擊,以及滾動鼠標滾輪。
再比如可以鍵盤控制,輸入文本、按下、釋放單個或多個鍵,以及模擬快捷鍵操作。
它主要能用來做什麼?
典型的,可以自動化任務。
比如填寫表單、點擊按鈕,或者做一些自動化重複性工作,例如登錄系統、運行測試。
也有人用來做遊戲腳本,模擬點擊和操作。
哈,啥都能和玩兒掛上鉤。
pyautogui的問題是,功能太單一。
比如想從網頁上獲取數據,就必須對網頁做一些交互,比如點擊、複製之類。
就會依賴於點擊的位置。
所以它只能是針對特定問題的一次性解決方案,不具備通用性。
怎麼辦?
2
既然想獲取的內容在網頁上,那我們就用專門針對網頁的庫。
比如selenium。
什麼是selenium?
Selenium 是一個廣泛使用的開源工具,用於自動化 Web 瀏覽器的操作。
它支持多種編程語言,比如 Python、Java、C# 等。
常用於 Web 應用測試、數據爬取以及自動化任務。
可以看做網頁專用機器人。
我們可以用它來做一些瀏覽器自動化任務。
具體來說,可以模擬用戶在瀏覽器中的操作,例如點擊、輸入、滾動、截圖等。
selenium兼容多個主流瀏覽器,包括 Chrome、Edge、Firefox 和 Safari 等。
說到這兒,有點憂傷。
目前東哥的主力瀏覽器,是Edge,爲的是設置啥的能跟着俺的微軟賬戶同步。
而世界範圍內,更主流的瀏覽器是Chrome。
根據最新的市場數據,2024年12月全球瀏覽器市場的佔有率如下:
谷歌Chrome:66.88%。
微軟Edge:13.21%。
蘋果Safari:8.49%。
Mozilla Firefox:6.14%。
Opera:2.74%。
Chrome穩居市場首位。
但是,我們的網絡狀況,用不了……
哎。
回過頭來,咱繼續聊selenium。
具體的技術細節,咱這裡就不討論了。
畢竟咱不是專業的IT賬號。
而且怎麼實現這些功能,用ChatGPT比東哥更高效。
東哥使用下來的感受是,適度的自動化是最好的。
不要嘗試所有內容都交給自動化腳本,那樣腳本會無比複雜。
比如網頁導航,以及動態數據展示,就可以手工處理。
把剩下的重複性工作,交給selenium。
用selenium採集到數據之後,就可以把文本內容交給pandas等更專業的文本及數據處理工具,做進一步加工了。
3
東哥利用selenium,把之前估計需要用一週才能完成的任務,花了大概兩個小時就搞定了。
其中有一個多小時,是在和ChatGPT聊天。
告訴它我的需求,讓它一點點完善和調整。
ChatGPT的出現,極大的拓展了東哥的邊界。
而這一切,纔剛剛開始。
關注東哥,保護中產財富,一起慢慢變富。
東哥目前提供如下服務,有需要的朋友歡迎微信來撩。
,一個經營強鏈接的社羣。
羣裡有老闆、投資人、500強高管、律師、HR……
討論個人IP打造、中年人第二曲線、碩博學歷提升、企業出海項目等。
,分享一些專業金融知識及硬核資訊;
討論香港保險、香港銀行開戶、美股投資、比特幣投資、房產投資等。
,1-2小時的深度交流。
涵蓋自媒體指導、職業規劃、就業指導、IP打造、個人優勢挖掘、銷售獲客技巧、資源鏈接等。
人是萬物的尺度。找一羣人一起走,一起慢慢變富。