91视频观看-91视频观看免费-91视频免费网址-91视频免费网站-国产日产欧产精品精品推荐在线-国产日产欧美a级毛片

太平洋電腦網 4小時前

OpenAI 推出強化微調技術助力精準定制 o4-mini 模型

【太平洋科技快訊】5 月 9 日，OpenAI 在其緊湊型推理模型 o4-mini 上推出了強化微調技術 ( Reinforcement Fine-Tuning, RFT ) ，為定制基礎模型以適應特定任務提供了強大工具。

OpenAI 的強化微調技術 ( RFT ) 將強化學習原理融入語言模型的微調過程。這一方式打破了傳統微調模式，開發者不再僅僅依賴于標注數據，而是可以通過設計任務特定的評分函數 ( grader ) 來評估模型輸出。這些評分函數根據自定義標準 ( 例如準確性、格式或語氣 ) 為模型表現打分，模型則通過優化獎勵信號逐步學習，生成符合期望的行為。這種方法在處理難以定義標準答案的復雜任務時尤為有效，例如在醫療領域，開發者可以通過程序評估解釋的清晰度與完整性，指導模型改進。

o4-mini 是 OpenAI 于 2025 年 4 月發布的一款緊湊型推理模型，支持文本和圖像輸入，擅長結構化推理和鏈式思維提示 ( chain-of-thought prompts ) 。通過在 o4-mini 上應用 RFT，OpenAI 為開發者提供了一個輕量但強大的基礎模型，適合高風險、領域特定的推理任務，其計算效率高，響應速度快，非常適合實時應用場景。

使用 RFT 技術需要完成四個步驟：設計評分函數、準備高質量數據集、通過 OpenAI API 啟動訓練任務、持續評估和優化模型表現。多家早期采用者已展示 RFT 在 o4-mini 上的潛力，凸顯了 RFT 在法律、醫療、代碼生成等領域的定制化優勢。

據悉，RFT 目前向認證組織開放，訓練費用為每小時 100 美元。若使用 GPT-4o 等模型作為評分工具，則額外按標準推理費率計費。為了鼓勵數據共享，OpenAI 還推出激勵措施，同意共享數據集用于研究的組織可享受 50% 的訓練費用折扣。

查看原文

宙世代

ZAKER旗下Web3.0元宇宙平臺

一起剪

ZAKER旗下免費視頻剪輯工具

熱門推薦

Blockchain News

91视频观看-91视频观看免费-91视频免费网址-91视频免费网站-国产日产欧产精品精品推荐在线-国产日产欧美a级毛片

宙世代元宇宙

元宇宙黨建解決方案

元宇宙文旅解決方案

元宇宙展廳解決方案

元宇宙行業峰會解決方案

元宇宙營銷解決方案

元宇宙會展解決方案

元宇宙演藝節目解決方案

元宇宙博物館解決方案

元宇宙圖書館解決方案

元宇宙校園解決方案

元宇宙企業展廳解決方案

元宇宙藝術展解決方案

元宇宙電商解決方案

融媒體解決方案

ZAKER智慧云

媒體解決方案

黨建解決方案

公檢法解決方案

智慧交通解決方案

高校解決方案

AI視頻剪輯

AI視頻剪輯

AI智能客服

AI工具箱

AI寫稿助手

AI口語陪練

我的訂閱

OpenAI 推出強化微調技術 助力精準定制 o4-mini 模型

宙世代

一起剪

相關閱讀

百度、阿里爭奪AI定義權

小紅書，新一代“淘寶客”？

支付寶微信自動扣款服務沖上熱搜第一 客服：不會亂扣費

京東首創外賣行業最嚴準入標準：發現無堂食餐廳獎勵40元飯卡

榮耀400系列中國版本為特供加強版：配置大升級

99元 小米無線鍵鼠套裝3發布：104鍵全尺寸、鼠標僅重45g

中國人均每天觀看視聽節目超3小時 刷抖音占一半

“大疆教父”李澤湘沖擊港股自動駕駛卡車第一股

極氪回應引入合伙人模式：并非轉經銷商 核心是代理制

盧偉冰親自操刀打造！小米Civi 5 Pro本月登場：驍龍8s Gen4加持

換手機微信遷移太慢！官方支招：3步就能提速

別想提前看評測！曝RTX 5060上市前將無驅動發布

百度地圖市場滲透率第一 導航“見縫插針”植入廣告

Hi暢享80系列：鴻蒙生態手機的可靠耐用之選

好萌好軟人人愛 ROG B850小吹雪主板拉滿體驗價值

最新評論

太平洋科技

熱門推薦

OpenAI 推出強化微調技術助力精準定制 o4-mini 模型

支付寶微信自動扣款服務沖上熱搜第一客服：不會亂扣費

99元小米無線鍵鼠套裝3發布：104鍵全尺寸、鼠標僅重45g

中國人均每天觀看視聽節目超3小時刷抖音占一半

極氪回應引入合伙人模式：并非轉經銷商核心是代理制

百度地圖市場滲透率第一導航“見縫插針”植入廣告