<li id="wkceg"></li>
<rt id="wkceg"><delect id="wkceg"></delect></rt>
<bdo id="wkceg"></bdo>
<strike id="wkceg"><acronym id="wkceg"></acronym></strike>

  • 賬號:
    密碼:
    智動化 / 文章 /

    強化學習:入門指南
    [作者 Emmanouil Tzorakoleftherakis]   2019年10月29日 星期二 瀏覽人次: [13269]

    強化學習(Reinforcement learning)潛力無窮,能解決許多開發應用上面臨的艱難決策問題,包括產業自動化、自主駕駛、電玩競技游戲以及機器人等,因此備受矚目。


    強化學習是機器學習(Machine learning)的一種,指的是電腦透過與一個動態(dynamic)環境不斷重復地互動,來學習正確地執行一項任務。這種嘗試錯誤(trial-and-error)的學習方法,使電腦在沒有人類干預、沒有被寫入明確的執行任務程式下,就能夠做出一系列的決策。最著名的強化學習案例就是AlphaGo,它是第一支打敗人類圍棋比賽世界冠軍的電腦程式。


    強化學習的運作主要是仰賴動態環境中的資料—也就是會隨著外部條件變化而改變的資料,像是天氣或交通流量。強化學習演算法的目標,即是于找出能夠產生最佳結果的策略。強化學習之所以能達成目標,是借著軟體當中被稱為主體 (agent)的部分在環境中進行探索、互動和學習的方法。
    ...
    ...

    另一名雇主 限られたニュース 文章閱讀限制 出版品優惠
    一般訪客 10/ごとに 30 日間 読み取れません 付費下載
    注冊會員 無限制 10/ごとに 30 日間 付費下載
    VIP會員 無限制 20/ごとに 30 日間 付費下載
    金卡會員 無限制 無限制 特別割引
    相關文章
    ? 以馬達控制器ROS1驅動程式實現機器人作業系統
    ? CAD/CAM軟體無縫加值協作
    ? 確保機器人的安全未來:資安的角色
    ? 雙臂機器人引風潮 類人形應用尤欠東風
    ? 量子運算:打造自動駕駛汽車新領域
    comments powered by Disqus
      相關新聞
    » 臺達攜手珍古德協會與海科館 三方合作推動珊瑚復育教育
    » 嘉義縣以空品監測即時掌控工廠火災應變措施
    » 裕民航運聚焦於凈零轉型與全球布局 以營運韌性拓展綠色未來
    » 臺達於COMPUTEX 2025聚焦人工智慧與節能永續
    » 臺達電子公布一百一十四年四月份營收 單月合并營收新臺幣407.82億元
      相關產品
    » 泓格iSN-811C-MTCP紅外線感測模組 從溫度掌握工業制造的安全與先機
    » 凌華科技透過 NVIDIA JetPack 6.1 增強邊緣 AI 解決方案
    » 安勤推出搭載NVIDIA Jetson平臺邊緣AI方案新系列
    » 臺達全新溫度控制器 DTDM系列實現導體加工精準控溫
    » 西門子下一代AI增強型電子系統設計軟體直觀且安全

    主站蜘蛛池模板: 浠水县| 通许县| 五原县| 汨罗市| 英超| 叙永县| 曲松县| 收藏| 木里| 合山市| 三门峡市| 仁怀市| 麻城市| 安新县| 获嘉县| 罗城| 嘉兴市| 汉中市| 平泉县| 中阳县| 高陵县| 梁平县| 临安市| 东台市| 杂多县| 绥德县| 于都县| 乌兰察布市| 会昌县| 大姚县| 孝义市| 安吉县| 新兴县| 西华县| 呈贡县| 绵竹市| 仁布县| 山丹县| 长宁县| 兴仁县| 新安县|