機器視覺可以看作是與人工(gōng)智能和模式識别密切相關的一(yī)個子學科或子領域。從我(wǒ)個人的研究經驗看,限制機器視覺發展的瓶頸是多方面的,其中(zhōng)最重要的可以歸結爲三個方面:計算能力不足、認知(zhī)理論未明以及精确識别與模糊特征之間的自相矛盾。
1.機器視覺面向的研究對象主要是圖像和視頻(pín),其特點是數據量龐大(dà)、冗餘信息多、特征空間維度高,同時考慮到真正的機器視覺面對的對象和問題的多樣性,單一(yī)的簡單特征提取算法(如顔色、空間朝向與頻(pín)率、邊界形狀等等)難以滿足算法對普适性的要求,因此在設計普适性的特征提取算法時對計算能力和存儲速度的要求是十分(fēn)巨大(dà)的,這就造成了開(kāi)發成本的大(dà)幅度提高。
2. 如何讓機器認知(zhī)這個世界?這一(yī)問題目前沒有成熟的答案,早期的人工(gōng)智能理論發展經曆了符号主義學派、行爲主義學派、連接主義學派等一(yī)系列的發展但都沒有找到令人滿意的答案,目前較新的思想認爲應該從分(fēn)析、了解和模拟人類大(dà)腦的信息處理功能去(qù)構建智能機器視覺系統,但神經科學的發展目前隻能做到了解和模拟大(dà)腦的一(yī)個局部,而不是整體(tǐ)(當然計算能力限制也是原因之一(yī))。事實上,我(wǒ)們對人是如何對一(yī)個目标或場景進行認知(zhī)的這一(yī)問題仍停留在定性描述而非定量描述上。
3. 機器視覺系統經常被人诟病的問題之一(yī)就是準确性。以十年前如火(huǒ)如荼的人臉識别算法爲例,盡管一(yī)系列看似優秀的算法不斷問世,但目前爲止在非指定大(dà)規模樣本庫下(xià)進行人臉識别的準确率仍然無法滿足實際應用的需求,因此無法取代指紋或虹膜等近距接觸式生(shēng)物(wù)特征識别方法。這一(yī)問題的出現并非偶然。因爲目标越精細,越複雜(zá),信息越大(dà),則其模糊性和不确定性也越強。人類之所以能夠較好的對人臉進行識别,其實也是以犧牲一(yī)定的準确性爲代價的。而機器視覺在做的事情一(yī)方面想要借鑒人腦或人眼系統的靈感去(qù)處理複雜(zá)而龐大(dà)的信息流,另一(yī)方面又(yòu)想摒除人腦在模式識别方面存在的精确性不足的缺陷。這顯然是一(yī)種一(yī)廂情願的做法。
綜合以上三點,機器視覺的發展在短期内難有重大(dà)突破,當前的實用技術仍然還是會集中(zhōng)在特定性任務或特定