亚洲精品乱码久久久久久久久久久久,亚洲中文字幕无码中文字在线,视频亚洲一区

<li id="wkceg"></li>

<rt id="wkceg"><delect id="wkceg"></delect></rt>

<bdo id="wkceg"></bdo>

<strike id="wkceg"><acronym id="wkceg"></acronym></strike>

|CTIMES│科技論壇│多媒體出版中心│社群討論│服務(wù)中心│

v1.0

8/20-23自動化x機(jī)器人展立即預(yù)登參觀

8/20-23自動化x機(jī)器人展立即預(yù)登參觀

智動化 / 文章 /

跨出影像分類：更多關(guān)於深度學(xué)習(xí)應(yīng)用

[作者 Johanna Pingel] 2018年11月20日星期二

瀏覽人次: [28012]

深度學(xué)習(xí)網(wǎng)路已被視為多功能的工具。雖然它最初主要被用來進(jìn)行影像的分類，不過深度學(xué)習(xí)網(wǎng)路也漸漸被運(yùn)用在其他各式各樣的任務(wù)。深度學(xué)習(xí)網(wǎng)路具備精確度以及處理速度—你不見得需要成為相關(guān)領(lǐng)域?qū)＜遥材軌驇椭銏?zhí)行龐大資料集的複雜分析。本文將列舉幾種可以考慮使用深度學(xué)習(xí)網(wǎng)路的任務(wù)案例。

文字分析

在這個範(fàn)例，我們將分析推特（twitter）資料來判斷某一個特定字詞或片語所夾帶的情緒是正面或負(fù)面。情緒分析可以被運(yùn)用在許多實(shí)際的應(yīng)用，比如品牌建立、政治活動、以及廣告。

機(jī)器學(xué)習(xí)從以前到現(xiàn)在被普遍使用在情緒分析。一個機(jī)器學(xué)習(xí)模型能夠分析個別字詞，不過深度學(xué)習(xí)模型卻可以用來完成句子，大幅地增加了精確度。

訓(xùn)練集之中包含了數(shù)以千計(jì)的推特訊息（tweets）範(fàn)例，這些訊息被歸類為正面或負(fù)面。以下為一個訓(xùn)練推特訊息的範(fàn)例：

推特訊息（Tweet）

情緒（Sentiment）

“I LOVE @Health4UandPets u guys r the best!!”

正面 Positive

“@nicolerichie: your picture is very sweet”

正面 Positive

“Back to work!”

負(fù)面 Negative

“Just had the worst presentation ever!”

負(fù)面 Negative

我們移除像是”the”和”and”等無法幫助演算法學(xué)習(xí)的停用詞來清理資料。接下來，我們上傳一個長短期記憶（long short-term memory，LSTM）網(wǎng)路，它是一種能夠隨著時間學(xué)習(xí)相依性的遞歸神經(jīng)網(wǎng)絡(luò)（recurrent neural network，RNN）。

LSTMs擅長分類順序和時間序列資料。而在分析文字時，LSTM不僅考慮到個別的字詞，也考慮到句子結(jié)構(gòu)和字詞的組合。

該網(wǎng)路的MATLAB程式碼很簡單：

layers = [ sequenceInputLayer(inputSize)

lstmLayer(outputSize,'OutputMode','last')

fullyConnectedLayer(numClasses)

softmaxLayer

classificationLayer ]

LSTM在GPU執(zhí)行訓(xùn)練的速度很快，只需要6分鐘就能處理完30個世代的資料（完整傳遞資料）。

我們所訓(xùn)練的模型也可以使用在新的資料。舉例來說，我們可以利用模型來判斷在情緒分?jǐn)?shù)和股價之間是否存在相互關(guān)係。

語音辨識

在這個範(fàn)例，我們想要把演說音訊檔分類到相對應(yīng)的字詞類別。乍看之下，這項(xiàng)任務(wù)的問題與影像分類完全不同，不過實(shí)際上卻相當(dāng)類似。光譜圖可以被視為把1D音訊檔案中訊號轉(zhuǎn)換為2D視覺化（圖1）。我們可以使用它作為卷積神經(jīng)網(wǎng)路（convolutional neural network，CNN）的輸入，如同我們使用一個「真正」的影像。

圖1 : （上）原始聲音訊號；（下）對應(yīng)光譜圖。

圖1 : （上）原始聲音訊號；（下）對應(yīng)光譜圖。

spectrogram（）函式是可以把音訊檔案轉(zhuǎn)換為對應(yīng)的時間定位頻率（time-localized frequency）的一種簡單方法。然而，演說是一種音訊處理的特定格式，它的重要特點(diǎn)被定位在特定頻率。由於想要讓CNN集中在這些定點(diǎn)，所以我們使用被設(shè)計(jì)來把目標(biāo)鎖定在與演說最為相關(guān)的頻率區(qū)域的梅爾頻率倒頻譜（Mel-frequency cepstral）係數(shù)。

我們把訓(xùn)練資料平均地分配到我們想要分類的字詞類別中。

為了降低錯誤的機(jī)率，我們加入一個類別來放置可能與期望類別混淆的字詞。比如說，期望的字詞是”on”時，像是”mom”、”dawn”、以及”won”等字詞會被放進(jìn)”unknown”類別。這個網(wǎng)路並不需要知道這些字詞，因?yàn)樗麄儾皇且槐孀R的單詞。

我們接下來定義一個CNN。由於我們以光譜圖作為輸入，因此我們可以把類似於影像CNN的架構(gòu)用在這裡。

模型在經(jīng)過訓(xùn)練之後，它會將輸入影像（光譜圖）分類到適當(dāng)?shù)念悇e（圖2）。確認(rèn)資料集（validation set）的準(zhǔn)確度約為96%。

圖2 : 單字”yes”的分類結(jié)果

圖2 : 單字”yes”的分類結(jié)果

影像降噪

小波和濾波器一直以來都是常見的降噪方法。在這段範(fàn)例，我們將看到預(yù)訓(xùn)練（pretrained）影像降噪CNN（DnCNN）如何應(yīng)用在一組包含高斯雜訊（Gaussian noise）的圖片（圖3）。

圖3 : 加入高斯雜訊的原始影像

圖3 : 加入高斯雜訊的原始影像

我們由下載一張內(nèi)含高斯雜訊的圖片開始。

imshow（noisyRGB）;

由於這是一張彩色的圖片，而網(wǎng)路是以灰階圖片訓(xùn)練，這項(xiàng)處理唯一比較棘手的地方是要把圖片分離為三個單獨(dú)的通道：紅（red，R）、綠（green，G）、藍(lán)（blue，B）。

noisyR = noisyRGB（:,:,1）;

noisyG = noisyRGB（:,:,2）;

noisyB = noisyRGB（:,:,3）;

載入預(yù)訓(xùn)練的DnCNN網(wǎng)路。

net = denoisingNetwork（'dncnn'）;

現(xiàn)在我們可以使用它來從每一個顏色通道移除雜訊。

denoisedR = denoiseImage（noisyR,net）;

denoisedG = denoiseImage（noisyG,net）;

denoisedB = denoiseImage（noisyB,net）;

接著重新合併經(jīng)過降噪的顏色通道來形成經(jīng)過降噪的RGB圖片。

denoisedRGB = cat（3,denoisedR,denoisedG,denoisedB）;

imshow（denoisedRGB）;

title（'Denoised Image'）

快速地看一下來比較原圖（無噪）和經(jīng)過降噪的圖片，可以得到還算合理的結(jié)果。

圖4 : （左）原圖（無噪）；（右）經(jīng)過降噪的圖片。

圖4 : （左）原圖（無噪）；（右）經(jīng)過降噪的圖片。

我們再來把圖片放大來檢查幾個細(xì)節(jié)：

rect = [120 440 130 130] ;

cropped_orig = imcrop（RGB,rect）;

cropped_denoise = imcrop（denoisedRGB,rect）;

imshowpair（cropped_orig,cropped_denoise,'montage'）;

圖5放大後的影像顯示降噪夾帶了一些副作用—顯然地，原圖的解析度較高，特別是在屋頂和草的地方。接著，可以視圖片的使用目的來決定降噪結(jié)果可以被接受，或者需要進(jìn)一步的處理圖片。

圖5 : 放大後的部分圖片。

圖5 : 放大後的部分圖片。

如果你考慮使用DnCNN來進(jìn)行影像降噪，要記住它只能辨識被訓(xùn)練過的雜訊類型—在這個範(fàn)例是高斯雜訊。如需要更大的彈性，你可以使用MATLAB和深度學(xué)習(xí)工具箱（Deep Learning Toolbox），利用預(yù)先定義的層級來訓(xùn)練自己的網(wǎng)路，或者完全客製一個降噪神經(jīng)網(wǎng)路。

（本文作者Johanna Pingel任職於MathWorks公司）

相關(guān)文章

?	NASA太空飛行器任務(wù)開發(fā)光學(xué)導(dǎo)航軟體
?	近即時模擬與控制協(xié)助自主水下載具機(jī)動運(yùn)行
?	資料科學(xué)與機(jī)器學(xué)習(xí)協(xié)助改善頸部損傷評估
?	配電網(wǎng)路的即時模擬環(huán)境開發(fā)
?	MATLAB與Simulink整合自動化機(jī)器學(xué)習(xí)與DevOps

comments powered by Disqus

相關(guān)新聞

»	助臺灣企業(yè)跨國資安防禦情資專家強(qiáng)調(diào)Team Taiwan理念
»	臺達(dá)支持全臺首部8K深海紀(jì)錄片電影《沈睡的水下巨人》呼籲海洋保育與珊瑚復(fù)育
»	臺達(dá)於2025漢諾威工業(yè)展展出多元AI賦能解決方案推動智慧產(chǎn)業(yè)與永續(xù)能源轉(zhuǎn)型
»	臺達(dá)榮獲「IT Matters 數(shù)位轉(zhuǎn)型獎」肯定彰顯科技創(chuàng)新與數(shù)位轉(zhuǎn)型成效
»	PTC 與微軟和Volkswagen集團(tuán)合作開發(fā)生成式Codebeamer AI Copilot

相關(guān)產(chǎn)品

»	凌華科技透過 NVIDIA JetPack 6.1 增強(qiáng)邊緣 AI 解決方案
»	PTC產(chǎn)品生命週期管理SaaS前四季訂單翻倍
»	PTC推出新版ThingWorx製造業(yè)應(yīng)用程式
»	西門子計(jì)畫推出全新數(shù)位化零件製造平臺
»	MAKEVR將專業(yè)設(shè)計(jì)、模型製作、3D列印帶入虛擬實(shí)境

?

｜

｜

｜

著作權(quán)聲明

｜

隱私權(quán)聲明

｜

	︱	Copyright ©1999-2025 遠(yuǎn)播資訊股份有限公司版權(quán)所有 Powered by O3
		地址:臺北數(shù)位產(chǎn)業(yè)園區(qū)（digiBlock Taipei） 103臺北市大同區(qū)承德路三段287-2號A棟204室電話 (02)2585-5526 #0 轉(zhuǎn)接至總機(jī) / E-Mail: webmaster@hope.com.tw

主站蜘蛛池模板：云梦县| 河东区| 灌云县| 大庆市| 鲁甸县| 辽源市| 鹰潭市| 武穴市| 淮滨县| 乐昌市| 揭阳市| 湖州市| 顺义区| 华蓥市| 依安县| 溧水县| 广饶县| 军事| 阆中市| 青铜峡市| 章丘市| 鲁山县| 宣恩县| 万源市| 田东县| 志丹县| 白水县| 来凤县| 磴口县| 临洮县| 松原市| 高陵县| 全州县| 赫章县| 迭部县| 左云县| 汝州市| 齐齐哈尔市| 县级市| 即墨市| 满城县|