구글 번역(translate.google.com)과 네이버 번역이 싹 바뀌었다. 네이버 버전은 아직 정식 서비스는 아니지만 별도의 사이트(labspace.naver.com)에서 체험 가능하다. 아니면 플레이스토어나 앱스토어에서 ‘파파고’ 앱을 받아도 된다.

 

원래는 어땠냐면 이랬다.

 

나쁜 상사, 이때만 해도 퇴근을 다 work라고 번역했다. <출처: 나무위키>

 

The 백조마리가 살았습니다. 오래전에.

 

원래 네이버는 통계식 번역을, 구글은 그냥 영어사전식 번역을 썼다. 통계식이 뭐냐면 컴퓨터가 번역을 할 때 여러 단어 중 사람들이 가장 많이 채택한 단어를 골라 대체하는 방식이다. 구글은 그런 거 없고 그냥 단어장을 나열했다.

 

지금은 구글 번역의 이 기능이 사라져 체험해볼 순 없지만 이런 번역도 있었다.

 

Watch your step → 당신의 단계를 시청

뭐 임마?

 

 

그런데 이렇게 난해하던 구글과 네이버의 번역이 갑자기 확 좋아졌다. 인공신경망 덕분이다.

 

다음은 인공신경망이 적용되기 전 구글 번역기로 고통받던 사람들의 기록이다. 네이버 지식인에서 ‘구글 번역기’를 검색하면 “구글 번역기가 이상해요ㅠㅠ”라며 이런 발번역 예시가 나온다. 그래서 이걸 인공신경망이 업그레이드된 지금 번역기와 비교해 봤다.

 

예시 1)

However, this invention is not only for the Chinese. Mr.Zander also hopes to sell the charger to countries that have a poor electiricity supply. For example, farmers in Senegal use cell phones to check on crop prices, and health workers in South Africa use their phones to check patient records. Mr.Zander didn’t mention students who ride their bicycles to school, but they could be possible customers too. Perhaps students will ride an extra kilometer so they can text their friends in class!

구 버전 구글 번역) 그러나이 발명뿐만 아니라 중국입니다. mr.Zander 또한 가난한 electiricity의 supply. For 예제를 가지고 국가에 충전기를 판매하는 것을 목표로, 세네갈 사용 휴대폰에서 농민은 농작물 가격을 확인하고, 남부 아프리카의 건강 근로자 환자 기록을 확인하기 위해 전화를 사용합니다.

 

신 버전 구글 번역) 그러나,이 발명품은 중국인을위한 것이 아닙니다. mr.Zander는 또한 전기 공급이 부족한 국가에 충전기를 판매하기를 희망하고 있습니다. 예를 들어 세네갈의 농민들은 휴대 전화를 사용하여 작물 가격을 확인하고 South Arica의 의료 종사자는 전화기를 사용하여 환자 기록을 확인합니다.

 

예시2)

When the final filter is defined click the ok button. Undo will deselect the last selection made, using Undo again will result in the previous selection being deselected etc., etc

구 버전 구글 번역) 최종필터가정의 될 때확인 버튼을 클릭합니다.실행 취소다시이전 선택에발생합니다사용,마지막선택이선택 해제됩니다취소는선택 해제되는등,등

 

신 버전 구글 번역) 최종 필터가 정의되면 확인 버튼을 클릭하십시오. 실행 취소는 마지막 선택을 취소하고, 실행 취소를 다시 사용하면 이전 선택이 선택 해제됩니다.

 

깔끔하다. 이렇게 진화를 가능케 한 이 ‘인공신경망’이란, 인공지능을 생물의 신경 형태로 따라만드는 거다. *빅데이터 다들 들어봤지? 신경망을 만드는 방식이 빅데이터다. 무슨 말인지 나도 잘 모른다. 빅데이터를 만드는 방식을 더러 ‘머신 러닝(Machine Learning)’이라고 한다. 기계가 공부한다는 뜻이다.

 

*빅 데이터: 기존 데이터보다 너무 방대하여 기존의 방법이나 도구로 수집/저장/분석 등이 어려운 정형 및 비정형 데이터. 이 데이터를 효과적으로 분류하고 그 안에서 원하는 정보를 빠르게 찾아내는 과정을 의미하기도 한다.

 

그중 심화반 기계 애들을 딥 러닝(Deep Learning)이라고 한다. 알파고는 그중 우등생이고, 열심히 공부한 네이버와 구글 번역이 드디어 심화반에 들어온 거다. 딥러닝의 원리는 ‘패턴 발견’인데, 이걸 설명할 땐 흔히 고양이 사진이나 사람 얼굴을 예로 든다.

 

일단 고양이 사진을 인공지능에게 보여주면, “아 이게 고양이구나”라고 이해하는데, 이 때 인공지능은 고양이 수염, 눈, 주름, 귀 등을 여러 단계로 분해해서 조합한 상태로 이해한다.

 

이런 식이다. 알파고는 아래의 선들로 윤곽을 만들어서 얼굴까지 인식한다.

 

그럼 다른 고양이 사진을 또 막 주면 “아! 이건 다른 고양이구나” “아! 이건 고양이 옆 얼굴이구나” “아! 이건 고양이같이 생긴 동물이구나”를 ‘수억 번의 반복학습을 통해’ 인지하게 되는 거다.

 

이렇게 이해하면 고양이가 하나도 안 귀엽겠다

 

그러면 포토샵에서 본 레이어 개념을 도입해서 여러 레이어를 비교해가면서 공부한다. 사람이라면 시간도 오래 걸리고 싫증도 느끼지만 기계는 반복학습을 매우 빠르게 한다. 그래서 알파고는 고양이가 뭔지 이해하게 되는 것.

 

텍스트의 경우엔 디지털 데이터라서 이해하는 건 쉬운데, 문제는 나라마다 언어체계가 다른 것이다. 예를 들어서 *“용이 내가 된다”는 문장을 줬다 치자. 그럼 알파고는 “Dragon becomes me!”라고 번역하겠지.

*게임 <오버워치> 중 주인공 겐지가 용검을 꺼내들며 용으로 변신할 때 외치는 대사.

용이 내가 된다!

 

그런데 사실 이 문장은 “내가 용이 된다”가 진짜 의미다. 그러니까 알파고는 처음엔 Dragon becomes me라고 번역하다가, 여러 애니메이션이나 게임 대사를 공부하고 나서는 ‘I’m gonna be a dragon’이나 ‘I have a dragon power!’라고 번역할 수도 있겠지. 사람이 번역을 할 때처럼.

 

이런 인공신경망 번역은 네이버가 먼저 베타 서비스로 도입했고 구글은 정식 서비스로 도입했다. 네이버는 별도 사이트에서 번역해야 하고 200자 제한이 있지만, 구글은 벌써 서비스를 다 도입해놨다. 전문가들 의견으로는 번역 품질도 구글 쪽이 조금 더 낫다고.

 

다음은 이번 2017년 대입 수학능력시험 영어영역 중 오답율이 제일 높은 문제다. 번역 보지 말고 일단 풀어보자.

 

 

자, 이제 마음속에 답을 하나 갖고 있겠지. 그럼 번역을 한번 보자. 다음은 구글의 번역 결과다

 


33. 슬픔은 불쾌합니다. 그렇다면 전혀 없으면 더 좋지 않겠습니까? 손실이 실제로 발생하는 경우에도 왜 받아 들여야합니까? 아마도 우리는 Spinoza가 후회에 대해 말했던 것, 즉 그것을 느낀 사람은 “두 번 불행하거나 두 번이나 무력 함”이라고 말할 것입니다. 로렌스 토마스 (Laurence Thomas)는 “부정적인 정서”(슬픔, 죄책감, 분노, 분노와 같은 감정들, 우리가없이 더 나아질 수 있다고 믿는 이유가있는)의 유용성은 그들이 사랑과 존경 같은 처분 적 감정…(중략)


 

사실 잘 모르겠다. 그냥 영어를 해석하는 것이 아닌 철학적인 문제라서 그런 것도 있고, 흔히 안 쓰는 영어를 퍼부어서 그렇기도. 그럼 답은 뭘까? 수능 해설서를 갖고 왔다!

 


33. 슬픔은 불유쾌하다. 그렇다면 그것이 완전히 없는 상태라면 더 행복하지 않을까? 손해를 보는 것이 확실한데도 왜 그것을 받아들이는가? 아마도 우리는 스피노자가 후회에 대해 이야기한 말, 즉 누구든지 그것을 느끼는 자는 ‘두 배 불행하거나 두 배 무기력하다’는 말을 그것에 대해 이야기해야 할 것이다. Laurence Thomas는 ‘부정적인 감정’(없으면 우리가 더 행복할 것이라고 믿을 이유가 있어 보이는 감정들인 슬픔, 죄책감, 분개함, 분노와 같은 감정들)의 유용성이 그것들이 사랑과 존경심과 같은 그런 성향적인 감정에 대한 일종의 진실성을 보장해 준다는 점에서 찾을 수 있다는 것을 암시했다…(중략)


 

 

근데 풀이를 봐도 잘 모르겠다. 어쨌든 답은 1번. 번역 품질은 구글이 네이버보다 더 좋았다. 이걸 ‘인공신경망이 적용되지 않은’ 원래의 네이버 번역으로 검색하면 어떻게되는지 알아보자.

 


33. 슬픔은 불쾌한 일이다. 하나 더 나은 그런 없이 완전히지 않을까요? 있을 때도 이들은 손실이 진짜인지 그것을 받아들이는? 아마도 우리는 그것을 스피노자의 후회:든“두번 또는 두번 무력한 불행하다.”은 느낀 것을 말해야 한다.


….그만 알아보자.

 

어째 점점 우리가 영어 공부 안 해도 되는 시대가 오고 있다. 나중에는 귀에다 통역기 끼고 대화할 수도 있고, ‘가디언즈오브갤럭시’에 나오는 범우주 동시 통역기같은 게 설치될 수도 있겠다. 그럼 토익 공부 이거 왜 했어.


[한국뉴욕주립대학교] 대학원생 모집

ICT명품인재양성사업 박사과정 학생 선발


대학생 되니 사라졌다? 고딩 때만 썼던 특수능력 6

1. 한겨울도 스타킹 하나로 버티는 능력

 

#독자참여 #광화문

100만개가 넘는 촛불이 광화문 광장을 밝힌 지 벌써 한 달이 지났습니다.

 

20대에게 차가 필요한 순간

지옥 같은 통학버스 때문에 학교 가기가 두렵다면?

 
시리즈신여성의 화장대

언니 믿지? Makeover

언니 믿길 잘했지?

 

만화책이 우리를 보우하사

우리를 웃기고, 부들부들 떨게 하며, 이따금 위안하는 만화책 5선

 

전자레인지로 ok! 매그놀리아st 바나나푸딩

자취방에서 만드는 노오븐 디저트!

 

소 방 관 의 멋

“그냥요. 사람 구하는 일이 좋았어요.”

 

2017년 알차게 시작하고 싶은 대외활동 BEST4

미리미리 준비하는 2017년

 

어느 우울한 탈모인의 고백

오늘도 머리숱으로 고민하는 모든 탈모인들을 위해

 

코타츠가 있는 만화 카페

한번 들어가면 겨울 내내 빠져나올 수 없다는 코타츠가 있는 곳

 
시리즈 로즈뷰티

어디서도 보지 못한 친절하고 정직한 뷰티!