2025-02-24 03:45
美國工作 💼 RTO Week 5 這禮拜只上了四天班,因為禮拜一是美國的 President Day,公司放假一天! 首先必須自首,這禮拜真的沒怎麼刷題,畢竟女朋友大老遠從台灣飛來奧斯汀找我,總不可能我下班還在那邊:「誒,給我四十分鐘,我刷個題~」吧😂 肯定是沒被扁過!不過,近日要來回歸了! 這週主要在探索新的工具,過去兩週 Sprint 是在研究 Kubeflow,現在新的 Sprint 則是研究 Ray。為了 PoC,我用過去的專案來整合 Ray 跑資料前處理/訓練/測試的 Pipeline,模擬並探索 Ray 在大規模資料處理上的表現。不得不說,玩了幾天它覺得超有趣!雖然 Ray 的設計理念是 Dataset 為核心,所以如果想用 Pandas DataFrame 的操作還是得稍微轉換寫法,用現有的 Ray Data API 來適應,不過這也讓我對 Distributed Data Processing 的思維更上一層樓。另外,他的 XGB Trainer 也很有趣,他是以 Booster 的型式存儲,跟我們過去習慣的分類器的型式不太一樣。期待新的一週,想找更多花樣。😆
30
回覆
1
轉發

作者

Haren Lin
hahahalum
profile
粉絲
385
串文
54+

回覆

轉發

24小時粉絲增長

發文前

348

發文後24小時

364

變化

+16 (4.60%)

互動率

(讚 + 回覆 + 轉發) / 粉絲數
8.05%

© 2025 Threadser.net. 版權所有。

Threadser.net 與 Meta Platforms, Inc. 無關,未經其認可、贊助或特別批准。

Threadser.net 也不與 Meta 的"Threads" 產品存在任何關聯。