2025-02-24 03:45
美國工作 💼 RTO Week 5
這禮拜只上了四天班,因為禮拜一是美國的 President Day,公司放假一天!
首先必須自首,這禮拜真的沒怎麼刷題,畢竟女朋友大老遠從台灣飛來奧斯汀找我,總不可能我下班還在那邊:「誒,給我四十分鐘,我刷個題~」吧😂 肯定是沒被扁過!不過,近日要來回歸了!
這週主要在探索新的工具,過去兩週 Sprint 是在研究 Kubeflow,現在新的 Sprint 則是研究 Ray。為了 PoC,我用過去的專案來整合 Ray 跑資料前處理/訓練/測試的 Pipeline,模擬並探索 Ray 在大規模資料處理上的表現。不得不說,玩了幾天它覺得超有趣!雖然 Ray 的設計理念是 Dataset 為核心,所以如果想用 Pandas DataFrame 的操作還是得稍微轉換寫法,用現有的 Ray Data API 來適應,不過這也讓我對 Distributed Data Processing 的思維更上一層樓。另外,他的 XGB Trainer 也很有趣,他是以 Booster 的型式存儲,跟我們過去習慣的分類器的型式不太一樣。期待新的一週,想找更多花樣。😆