<li id="wkceg"></li>
<rt id="wkceg"><delect id="wkceg"></delect></rt>
<bdo id="wkceg"></bdo>
<strike id="wkceg"><acronym id="wkceg"></acronym></strike>

  • 賬號:
    密碼:
    智動化 / 文章 /

    強化學習:入門指南
    [作者 Emmanouil Tzorakoleftherakis]   2019年11月14日 星期四 瀏覽人次: [11106]

    強化學習(Reinforcement learning)潛力無窮,能解決許多開發應用上面臨的艱難決策問題,包括產業自動化、自主駕駛、電玩競技游戲以及機器人等,因此備受矚目。


    強化學習是機器學習(Machine learning)的一種,指的是電腦透過與一個動態(dynamic)環境不斷重復地互動,來學習正確地執行一項任務。這種嘗試錯誤(trial-and-error)的學習方法,使電腦在沒有人類干預、沒有被寫入明確的執行任務程式下,就能夠做出一系列的決策。最著名的強化學習案例就是AlphaGo,它是第一支打敗人類圍棋比賽世界冠軍的電腦程式。


    強化學習的運作主要是仰賴動態環境中的資料—也就是會隨著外部條件變化而改變的資料,像是天氣或交通流量。強化學習演算法的目標,即是于找出能夠產生最佳結果的策略。強化學習之所以能達成目標,是借著軟體當中被稱為主體 (agent)的部分在環境中進行探索、互動和學習的方法。
    ...
    ...

    另一名雇主 限られたニュース 文章閱讀限制 出版品優惠
    一般訪客 10/ごとに 30 日間 読み取れません 付費下載
    注冊會員 無限制 10/ごとに 30 日間 付費下載
    VIP會員 無限制 20/ごとに 30 日間 付費下載
    金卡會員 無限制 無限制 特別割引
    相關文章
    ? 以馬達控制器ROS1驅動程式實現機器人作業系統
    ? CAD/CAM軟體無縫加值協作
    ? 確保機器人的安全未來:資安的角色
    ? 雙臂機器人引風潮 類人形應用尤欠東風
    ? 量子運算:打造自動駕駛汽車新領域
    comments powered by Disqus
      相關新聞
    » 臺達攜手珍古德協會與海科館 三方合作推動珊瑚復育教育
    » IPAC'25國際粒子加速器會議首度在臺登場 各國人才云集交流尖端科技
    » 杜邦公布其計畫分拆的電子業務獨立公司Qnity品牌識別
    » 意法半導體推出高整合低位電流感測放大器,簡化高精度量測設計
    » 意法半導體推出創新記憶體技術,加速新世代車用微控制器開發與演進
      相關產品
    » 意法半導體推出適用於數位鑰匙應用的新一代車用 NFC 讀寫器 擴展 ST25R 高效能產品系列
    » 適用于高頻功率應用的 IXD2012NTR 高壓側和低壓側柵極驅動器
    » KSC XA輕觸開關提供聲音柔和的輕觸回??,增強用戶體驗
    » 首款采用 DO-214AB 緊湊型封裝的 2kA 保護晶閘管
    » 意法半導體推出新款智慧型功率開關,具備小巧外型、高效率與高度可靠性

    主站蜘蛛池模板: 兖州市| 邹城市| 二连浩特市| 黎城县| 德兴市| 白朗县| 南投县| 本溪| 松阳县| 霞浦县| 鹰潭市| 涿州市| 福安市| 墨竹工卡县| 格尔木市| 英吉沙县| 荥经县| 扎兰屯市| 塔河县| 怀柔区| 蒙自县| 尉犁县| 荥经县| 开封市| 彰化市| 绥中县| 阳原县| 临邑县| 新河县| 华蓥市| 扬州市| 长宁县| 沙河市| 图们市| 嘉善县| 岳阳市| 黑龙江省| 乡宁县| 兴仁县| 沅陵县| 九台市|