온고창신 溫故創新 ongochangsin

AI(인공지능)에 대하여

<범용인공지능>으로 산업은 어떻게 변하는가? (2/2)

간천(澗泉) naganchun 2022. 6. 17. 02:43

<범용인공지능>으로 산업은 어떻게 변하는가? (2/2)

-강화학습의 대부가 말한다.-

 

 

 

메타(Meta)사 AI연구소의 중진인

*얀 루컨(Yann André LeCun)씨는 <불충분하다.>고 이론

 

 

물론 이 논문에는 많은 AI연구자가 이론을 내었다.

예를 들면 이론을 주창한 한 사람은 뉴욕대학교수로 Meta(Facebook)의 인공지능연구소 치프사이언티스트인 얀 루컨씨이다.

그는 2018년에 컴퓨터과학에서의 노벨상이라 할 수 있는 츄링상을 수상한 인물인데 자신의 트위터에서 “Reward is *clearly* not enough.(보수가 충분하지 않은 것은 분명하다.)고 반론하여 <세상에는 여러 가지 가제가 있고 각각 과제를 해결하는 데에는 다른 지능이 필요하다.>고 말하고 있다.

 

논문이 나와서 1년이 지난 지금 비즈니스 현장으로서 이 흐름을 어떻게 받아들일 것인가. 키워드는 <통합>에 있다고 나는 생각하고 있다.

이제까지의 개발현장에서는 화상인식, 자연언어처리, 음성인식 등 각 분야의 전문가가 그 분야에서 특화한 연구를 진행하고 그에 맞춘 모양으로 여러 가지 어프리케이션이 개발되고 있다. 그러나 최근에는 분야를 초월한 기술의 통합Consolidation이 진행되고 있다.

그래서 이러한 복수의 다른 기술을 통합한 소류션을 <멀티모달>한 소류션이라 부른다. <모달>은 입력정보의 종류를 말하는 것으로 멀티모달Multi-Modal이란 <복수종류의 입력정보를 이용한다.>고 하는 의미이다.

 

종래의 AI<화상만> <문자만> 등 취급하는 정보의 종류가 하나로 한정되어 있는 것이 일반적이었다.(싱글모달이라고 한다.)

한편 멀티모달AI는 인간이 눈이나 귀 등의 오감을 써서 여러 가지 정보를 모으는 젓과 같이 화상이나 문자. 음성, 영상 등의 복수의 정보를 동시에 취급한다.

<복수의 정보를 통합하여 처리하면 보다 인간에 가까운 판단이 가능할 것이 아닌가.>하는 것이 멀티모달의 하나의 사고방식이라 할 수 있다.(;Reward is Enough로는 멀티모달이라는 단어자체는 나오지 않는다.)

 

실제 멀티모달은 응용연구가 진행되고 있어서 예를 들면 텍스트. 음성, 화상 등의 정보를 조합한 멀티모달AI로서 차세대 제품정보의 연구 등도 진행되고 있다. 미쓰비시전기가 2021년에 발표한 논문에서는 카메라, LiDAR, 마이크 등의 멀티모달 센싱(Multimodal Sensing)한 정보를 묶어서 하나의 제품 해결책을 제안하고 있다.

또 테슬라에서 인공지능과 자동운전의 디렉터인 안드레 카파시Andrej Karpathy는 자신의 트위터에서 이하와 같이 AI연구에서의 기술의 통합에 언급하고 있다. 그런데 이 발언은 현재 A분야가 전환기에 있음을 시사하고 있는 것처럼 취할 수 있다.

<현재진행형으로 나가고 있는 AI분야의 통합에는 눈을 밝힐 것이 있다. 10년 정도 전에는 화상, 음성, 언어, 강화학습에 있어서 다른 분야의 논문을 읽는 것은 거의 불가능했다. 접근이 전혀 다르기 때문이다.>*

 

일본어원문=ドラえもんは実現できる強化学習のゴッドファーザーが言及する汎用人工 知能産業はどうわるか

출처=https://www.businessinsider.jp/post-253645

필자=*이시스미 도모에(石角友愛), 팔로 알토 인사이트(Palo Alto Insight)CEO.

도쿄도 태생, 2010년 하바드비지니스스쿨에서 MBA취득 후. 순천향대학원에서 데이터사이언스학과 객원교수, 실리콘발레 최첨단AI기술이나 DX전략을 일본기업에 도입.