토론 | 디지털 시민 광장, 캠페인즈

시티즌패스

추가

전체 팩트체크

투표

알리 테무 겨냥한 직구 금지 조치 필요할까요? 뭉게구름

100회 이상

진행중

윤석열 정부 2년, 기억에 남는 사건은? 맥북프로

600회 이상

진행중

채수근 상병 특검법, 어떻게 생각하시나요? 프링글스

200회 이상

진행중

계속 내려가는 한국 축구, 해결책은? tim2009

50회 이상

진행중

토론

AI 윤리 레터

39

안전한 AI만으로는 충분하지 않다

AI 안전을 넘어서는 AI 윤리의 필요성 by. 🤔어쪈 ‘AI 윤리 (Ethics)’보다 ‘AI 안전 (Safety)’이 훨씬 더 많이 보이는 요즘입니다. 물론 AI 안전이 새로운 용어는 아닙니다. 안전은 분명 AI 윤리 논의에서 빠질 수 없는 주요 가치죠. AI 윤리를 표방하는 유행어 역시 신뢰할 수 있는 (trustworthy) AI, 책임있는 (responsible) AI 등을 거쳐오긴 했지만, 안전한 AI가 거론되는 맥락을 자세히 살펴보면 단순히 표현만 바뀐 게 아니라는 생각이 듭니다. 단적으로 작년 11월 영국에서 열린 ｢AI 안전성 정상회의｣와 뒤이어 일어난 일들을 살펴볼까요. 당시 발표된 블레츨리 선언은 인권 보호, 투명성과 설명가능성, 공정성 등의 여러 가치를 언급하면서도 작금의 ‘프론티어 AI 시스템’에서는 특히 안전에 대한 우려가 크다고 천명했습니다. 이러한 기조는 다음주 한국에서 개최되는 후속 행사에서도 이어질 예정입니다. 2월에 착수한 <AI 안전 국제 과학 보고서>를 발표하고, AI 안전을 위한 국제 공조 방안을 논의한다고 하죠. 이미 영국과 미국은 발빠르게 AI 안전 연구소를 설립한 바 있습니다. 앞서 여러 차례 소개했던 백악관의 AI 행정명령 역시 안전을 가장 먼저 앞세우고 있죠. 기업들 역시 이러한 관심에 발맞춰 AI 안전을 강조하는 중입니다. 사실 엄밀히 말하자면 위와 같은 국제 협력이 착수되기 전부터 이미 AI 안전을 키워드로 홍보하고 있었죠. 현재 AI 분야에서 가장 주목받고 있는 오픈AI, 구글 딥마인드, 앤스로픽 등은 모두 회사 홈페이지에 안전을 내걸고 있습니다. 국내 기업 역시 마찬가지로 그동안 AI 윤리라는 이름 아래 보인 행보를 AI 안전을 위한 노력으로 재포장하는 모습입니다. 구글 딥마인드, 앤스로픽, 오픈AI 공식 웹사이트 갈무리 이토록 모두가 AI 안전에 신경쓰고 있다니, 정말 다행이고 또 환영할 일입니다. 그런데 잠시만요. 각국 정부나 기업이 말하는 AI 안전이란 무엇일까요? AI 안전에 집중된 논의가 놓치는 지점은 없을까요? AI 안전이 무엇인지 정의하기 위해서는 그에 상응하는 위험을 식별하는 작업이 선행되어야 하죠. 블레츨리 선언과 후속 논의를 살펴보면 크게 3가지 위험이 언급되고 있습니다. 요약하면 오작동, 악용, 통제 불가라고 할 수 있겠네요. 이러한 위험을 방지하고 AI 안전을 확보하기 위해 주로 채택되고 있는 방안은 ‘기술에 대한 연구와 평가’입니다. AI 안전 연구소를 설립해서 기술 인력을 확보하고, 기술 분야에서 앞서나가고 있는 AI 기업들과의 협력이 주된 방법으로 제시되고 있죠. 기업들의 AI 안전을 위한 활동 역시 기술에 초점이 맞춰져 있습니다. 최근 오픈AI가 그동안의 AI 안전 및 정렬(alignment)을 위한 노력의 결과물로 발표한 ‘모델 사양 (Model Spec)’을 살펴볼까요. 모델 사양은 AI 모델이 어떻게 행동해야 하는지에 대한 가이드라인입니다. 다시 말해 챗GPT가 어떤 질문이나 요청에 어떻게 답변하거나 하지 않을 것인지를 적은 문서죠. 예컨대 오픈AI의 AI 모델은 (방지하기 위한 것처럼 물어 대답을 유도하지 않는 이상) 범법 행위에 대한 정보를 출력해선 안되고, (설사 지구가 평평하다는 믿음을 가졌더라도) 이용자의 생각을 바꾸려 들면 안됩니다. 대다수의 AI 기업이 AI 안전을 위해 채택하고 있는 레드티밍(red-teaming)이라는 방법 역시 이와 결을 같이 합니다. 어떤 질문이나 요청에 생성형 AI 모델이 잘못된 출력을 하진 않는지 살펴보며 문제점을 찾는 레드티밍 기법은 AI 기술이 어떻게 기능해야 하는지에 주로 초점을 맞추고 있습니다. 지난 4월, 과학기술정보통신부 주최로 생성형 AI 레드팀 챌린지가 열리기도 했습니다. 하지만 AI 윤리 레터에서 다뤄온 문제들은 결코 AI 기술의 기능이나 사양에 국한된 논의만으로 해소되기 어렵습니다. 오작동하지 않고 악용되지 않는, 그리고 통제 불가능한 AGI 내지는 초지능이 아닌 ‘안전한’ AI 기술임에도 불구하고 위험을 안고 있거나 우려를 불러일으키는 사례가 많습니다. 월요일에 소개한 사업장 및 공공장소의 안면인식 출입시스템을 생각해볼까요. 모든 얼굴을 제대로 식별하고 회사나 경찰이 보안과 공공 안전을 위해서만 쓴다고 하더라도, 분명 그로 인해 위축효과라는 문제가 발생합니다. (안면인식 기술이 통제 불가의 AGI가 되진 않겠죠.) 기술을 우리가 갖고 있던 불편을 해소하고 문제를 해결하기 위해 도입하는 지극히 인간적이고 사회적인 방법으로 바라본다면, AI의 사양이나 어떻게 기능해야 하는지를 논하기 전에 어떤 문제를 풀기 위한 AI인지, 또 어떤 AI를 어떻게 개발해야 하는지를 물어야 하지 않을까요? AI 안전은 분명 AI 윤리 논의를 구성하는 주요 가치입니다. 하지만 안전한 AI를 개발하는 것이 곧 AI 윤리 논의의 종착점이 될 수는 없습니다. 안전하다는 게 무슨 의미인지와 같은 원론적인 질문까지 던지지는 않더라도, 누구에게 안전한지만을 묻더라도 AI 안전 역시 기술 그 자체에 대한 논의만으로는 확보되기 힘든 것임을 알 수 있습니다. AI 안전 확보를 위한 노력이 AI 윤리 논의에서 언급되는 다른 가치들과 함께 추구되기를 바랍니다. 댓글 🍊산디: 실제 정책적 논의 또한 구현된 기술 자체에 초점을 맞춰 이루어지고 있다는 생각이 들어요. 기술이 개발되는 과정과 방향에 대한 논의는 점차 뒷전이 되는 것 같구요. ‘윤리’라 하니 노잼으로 느껴질 수 있지만, 누가 어느 지점에 어떻게 개입할 것인가를 설계하는 건 흥미로운 작업인데 말이죠! AI 개발 무한 경쟁 속 윤리는 뒷전 by. 🎶소소 AI 기업들이 강조하는 AI 윤리는 실상 기업 내부에서 우선순위가 높지 않습니다. AI 기업들이 경쟁에서 앞서기 위해 끊임없이 더 빠르고 더 나은 성능의 AI 개발에 집중하고 있기 때문이죠. 경쟁 속에서 고객이나 윤리를 우선시하지 못하는 것이 현실입니다. 최근 구글과 마이크로소프트, 메타 등 주요 AI 기업의 개발자들이 이러한 반복적이고 무의미한 ‘쥐 경주(rat race)’ 속에 지쳐가고 있다는 보도가 있었습니다. 빅테크뿐 아니라 정부 AI 연구소, 스타트업할 것 없습니다. 미국만의 이야기도 아닙니다. 우리나라 상황도 마찬가지죠. 어느 한 회사가 새로운 AI 모델 성능을 발표하면, 바로 다음 추격이 시작됩니다. 상대 기업보다 먼저 AI 서비스를 발표하기 위해 불시의 기습 컨퍼런스도 마다하지 않습니다. 경쟁사에 집중될 이목을 우리 회사로 돌리기 위함이죠. 이렇게 치열한 경쟁 속에서 살아남기 위해서는 더 빠르게 움직여야 한다는 압박감은 서로를 옥죄고 있습니다. ChatGPT에게 시연자의 얼굴 표정을 읽어달라고 하는 모습(24:00), '구글 I/O' 하루 앞두고 GPT-4o를 기습 발표한 OpenAI 발표 화면 갈무리 이러한 무분별한 AI 개발 경쟁의 가장 큰 문제는 AI의 부작용을 고려할 시간이 없다는 것입니다. 개발 과정에서 충분한 평가와 검증이 이루어질 시간 없이 AI가 제품화되고 있기 때문인데요. 일례로 구글은 2023년 생성형AI 바드 시연에서 잘못된 답변을 내놓기도 했습니다. 이를 두고 내부 개발진의 “급했다. 망했다.”는 비판도 있었습니다. 구글은 이미지 생성AI 제미나이가 아이슈타인을 흑인으로 그리는 등 역사 속 인물을 유색 인종으로 표현한 오류에 대한 사과문을 발표하고, 해당 기능을 일시 중지하기도 했습니다. 한 엔지니어는 이러한 상황을 "비행기를 타고 가면서 비행기를 만드는 것과 같다”고 이야기했습니다. 엔지니어들에게 비판적 사고를 할 시간이 주어지지 않는다는거죠. AI 분야 연구자들은 몇 달 간 이어지는 긴급한 업무 일정 속에 번아웃을 경험하며 다른 직업으로의 전환을 고려한다는 이야기도 들려옵니다. 우리는 무엇을 위해 이토록 열심히 AI를 개발하는 걸까요? 이렇게 더 좋은 성능만 강조하는 풍토에서 AI 산업은 지속 가능할까요? 적어도 AI 개발자들이 AI 개발의 진정한 목적에 대해 생각할 수 있는 시간을 가질 수 있기를 바랍니다. AI 기술의 발전이 과연 누구를 위한 것인지, 그리고 그것이 우리 사회에 어떤 영향을 미칠지 말이에요. 오늘 이야기 어떠셨나요?여러분의 유머와 용기, 따뜻함이 담긴 생각을 자유롭게 남겨주세요.남겨주신 의견은 추려내어 다음 AI 윤리 레터에서 함께 나눕니다.

2024.05.16

·

AI 윤리 레터

40

스택오버플로, 너마저?

AI 윤리 뉴스 브리프 2024년 5월 셋째 주 by 🤖아침 1. 스택오버플로의 태세 전환과 보복성 제재 스택오버플로가 오픈에이아이에 모델 학습용 API를 제공하기로 했습니다. 이에 반발한 이용자들이 자신이 작성한 질문·답변을 삭제·수정하자, 운영진은 해당 이용자를 차단하는 등 제재를 가했습니다. 적잖은 플랫폼이 축적한 데이터를 AI 개발용으로 판매하는 추세 속에서도, 개발자 지식 공유 커뮤니티로 큰 상징성을 갖는 스택오버플로의 이런 행보는 인터넷 생태계 변화의 중요한 사례로 남을 것입니다. 얼마 전까지도 해당 플랫폼은 생성형 AI 사용을 금지했고, ‘커뮤니티를 중심에 두겠다’고 선언했다는 점에서 이용자들의 배신감이 배가될 듯합니다. 스택오버플로 이용약관에는 이용자가 작성한 모든 콘텐츠를 플랫폼이 영원히 이용할 수 있으며 이는 철회할 수 없다는 조항이 있습니다. 이용약관을 지렛대 삼아 플랫폼이 이용자 데이터를 마음대로 활용하는 현상은 물론 새로운 일이 아닙니다. ‘남용약관’이 플랫폼 자본주의의 기본적 작동 방식이라고도 볼 수 있죠. 앞으로도 계속 보게 될 이 광경을, 일반 이용자는 그냥 받아들이는 수밖에 없을까요? 게임의 규칙을 바꾸는 게 가능할까요? 덧붙이는 글 🎶소소: 커뮤니티 정신을 강조하던 스택오버플로, 정말 실망이네요. 결국 커뮤니티를 만든 이용자들이 아니라 돈이 되는 커뮤니티만을 중요하게 생각한다는 점이 여실히 드러나네요. 더 읽어보기 데이터, 어떻게 팔아야 잘 판 걸까? ...팔아야 하는 걸까? (2024-03-25) 스택오버플로, ‘(사람) 커뮤니티가 AI의 미래다’ (2023-07-31) 2. 싱가포르 출판·문학계는 데이터 제공이 탐탁지 않다 싱가포르 출판·문인들이 출판물을 AI 데이터로 활용하려는 정부 기조에 반발하고 나섰습니다. 싱가포르 정부는 말레이어, 타밀어, 화어 등 싱가포르에서 사용하는 언어 데이터를 반영하는 자체 다국어 멀티모달 LLM*을 구축하려 하고 있습니다. 이 과정에서 문인들을 상대로 저작물을 학습 데이터로 활용하는 데 대한 의견 수렴을 했는데요. 의견 수렴 이메일에서는 해당 데이터가 ‘연구 목적’으로만 활용될 것이라고 명시하고 있으나, 이용에 대한 보상이나 저작권 보호 관련된 설명이 부족하다고 판단한 문인들이 상당수 거부 의사를 표한 것입니다. 저작권자 동의 없이 일단 모델을 구축하는 행태가 보편적인 분위기에서, 어떻게 보면 이 정도 의견 수렴도 정부 입장에서는 꽤 진취적인 행보라고 볼 수도 있습니다. 한편 결국에는 정부 마음대로 문화콘텐츠를 이용할 것이라는, 회의적인 의견도 기사에 등장하고요. 하지만 비영어권 데이터가 부족한 현실을 고려할 때, 장기적으로 출판·문인들의 신뢰와 협조를 얻는 일은 싱가포르 정부에게 생각보다 더 중요할지도 모릅니다. * 텍스트 모델을 기반으로 하되 여러 모달리티(modality)를 처리할 수 있는 AI 모델. 예를 들어 챗봇에 이미지를 주고 내용을 묘사하는 글을 출력하는 방식. 모달리티는 기호학에서 글/이미지/음악 등의 양태를 가리키는 용어인데, AI 맥락에서는 ‘데이터 형식’과 비슷한 뜻으로 이해할 수 있습니다. 3. 현대중공업 노사갈등과 미국 대학 시위의 연결고리 지난 4월, HD현대중공업이 설치한 협력업체 근로자 출입 관리용 안면인식 출입시스템을 노조가 철거하고, 사측은 노조 간부를 경찰에 고발했습니다. 사측은 보안 관리상 안면인식기가 필요하다는 입장이고, 노조는 기존 수단으로도 관리가 가능한데 안면인식은 노동자를 감시/통제하는 수단일 뿐이라며 맞서고 있습니다. 금속노조 현대중공업지부는 성명서에서 공공장소의 얼굴인식 기술이 가져오는 ‘위축 효과’를 지적합니다. 개인 추적이 용이해지면서 합법적인 집회·결사의 자유 행사를 꺼리게 된다는 것이지요. 사업장과 공공장소는 같지 않다고 말할 수도 있겠지만 위축 효과는 확실히 생겨날 것 같습니다. Photo byArthur Mazi on Unsplash 미국 각지 대학교에서는 이스라엘의 팔레스타인 학살을 반대하는 시위가 한창입니다. 대학 당국이 시위 진압을 위해 안면인식 기술을 보유한 경찰에 공권력 투입을 요청하는 상황에서, 참여자들은 신상 노출에 따른 괴롭힘을 피하고자 케피예나 마스크를 쓰곤 합니다. 감시 기술이 시민 활동에 미치는 영향을 드러내는 사례입니다. 이스라엘, 러시아, 홍콩… 지난 몇 해간 계속 보아온 현상이죠. 앞으로 현대중공업 노동 쟁의 참여자 색출에 안면인식 시스템이 활용되리라 상상하는 것도 어렵지 않습니다. 더 읽어보기 [스트레이트] 탈탈 털린 스마트폰..검찰 ‘디넷’과 빅브라더 (MBC, 2024-04-28) 4. 우리 회사 AI는 에너지 1등급일까? AI 기술의 환경영향에 관한 정량연구를 꾸준히 해오고 있는 허깅페이스 연구팀에서 “AI 모델용 에너지소비효율등급”(Energy Star Ratings for AI Models)을 마련한다고 합니다. 여러 AI 모델이 일정한 작업을 수행하는 데 소비하는 전력량을 측정하여 효율등급을 부여하고, ‘녹색 AI 리더보드’ 순위표를 운영할 예정이라고 해요. 한국의 에너지소비효율등급과 직접적인 연관은 없습니다. 데이터센터의 탄소배출, 냉각수 등 AI 기술의 막대한 환경비용을 지적하는 목소리가 커지고 있지만 모델의 환경비용 측정은 여러 이유로 쉽지 않습니다. 데이터 수집에서 모델 구축, 실사용을 아우르는 전 과정이 수많은 이해관계자와 인프라 사이에 걸쳐 있고, 기술 개발을 주도하는 기업 측에서 정보 공개를 꺼리기도 하지요. 과학적 근거는 비판에 힘을 실어줍니다. 위 연구는 하드웨어, 입력값, 설정값 등을 통제한 조건에서 AI 시스템의 작동을 비교하여 환경비용에 관한 양적 데이터를 만듭니다. 특정 용도에 최적화한 모델보다 (프롬프트를 조작해 다용도로 활용하는) 제로샷 모델이 같은 작업을 할 때도 훨씬 에너지 소모가 크다는 초기 실험 결과는, 현재 테크업계의 파운데이션 모델 구축 경쟁이 기후에 미치는 악영향에 대한 근거인 셈입니다. 궁극적으로는 끝없는 스케일 경쟁보다 효율적이고 친환경적인 기술을 중시하는 쪽으로 패러다임이 전환되기를 기대해 봅니다. 더 읽어보기 미래의 시간을 쓰는 우리 (2023-12-18) 이 주의 인물 카드: 사샤 루치오니 (2023-07-03) 오늘 이야기 어떠셨나요?여러분의 유머와 용기, 따뜻함이 담긴 생각을 자유롭게 남겨주세요.남겨주신 의견은 추려내어 다음 AI 윤리 레터에서 함께 나눕니다.

2024.05.15

·

·

261

업데이트된 ChatGPT-4o(옴니), 영화 'Her'의 인공지능 비서가 될까

영화 'Her'를 보면, 사람들이 주로 음성으로 AI와 의사소통을 합니다. 이 과정에서 주인공인 테어도어는 인간처럼 반응해주는 AI '사만다'와 사랑에 빠지는데요. AI가 사람처럼 자연스럽게,빠르게 응답해 준다면 AI에게 감정을 느낄 수도 있겠다 싶죠. 한국 시간으로 2024년 5월 14일 새벽, OpenAI는 음성 비서 기능을 강화한 새로운 멀티모달모델(LMM)인 'GPT-4o'를 공개했습니다(관련 기사). 여기서 o는 모든 것이라는 '옴니'를 뜻한다고 하니, 한국어로 부르면 GPT-4 옴니 라고 불러야 할 지도 모르겠네요. 언론사들이 제목으로 '보고,듣고, 말할 수 있는 AI 등장'이라고 하는 내용은 사실과 조금 다른데요. 진작에 ChatGPT-4를 포함한 여러 AI에서 음성이나 사진, 영상을 보고 말할 수 있었기 때문입니다. 하지만 이번 모델에 와서 성능이 대폭 향상된 것은 사실입니다. 아직 일반 유저에게 공개되지는 않았지만, Chatgpt-4o를 통해 실시간으로 AI와 영상통화를 할 수 있는 것은 물론이고, 카메라를 통해 보는 정보를 실시간으로 해석해줍니다. 위에 영상에서는 표정을 읽고 해석하는 것은 물론이고, AI에게 '지금 실시간으로 너의 성능에 대해 발표하고 있어'라고 하니까 '부끄러우니 멈춰주세요' 라고까지 합니다. 영상을 보시면 목소리도 진짜 부끄러워 하는 듯 보입니다.위 영상 외에 다른 시연 영상에서는 '목소리를 기계처럼 바꿔서 말해줘'라고 하자 기계처럼 말하는 등 자연스러운 기능이 많아졌으며, 실시간으로 사람이 AI의 말을 끊고 대화에 간섭할 수 있는 등 놀라운 기능이 많아졌습니다. 이런 기능에 대한 업데이트나 데스크톱 앱 출시 등을 점차 진행할 예정이라고 하네요. 실시간 음성 채팅은 아직 업데이트가 되지 않아 사용해보지 못했지만, 업데이트된 GPT-4o는 현재 사용해볼 수 있어 직접 성능을 비교하고자 몇 가지 실험을 해봤습니다. 우선, 이미지를 이전보다 얼마나 질 인식하는지 궁금했습니다. 이전에 GPT-4에서는 이미지 인식 기능, 특히 이미지 안의 한자 등을 읽는 OCR기능이 아쉬웠거든요. 직접 보시면 아시겠지만, GPT-4는 엉뚱한 대답을 한 반면, GPT-4o는 어떤 한자가 쓰였는지 정확히 읽어냈으며, 그 맥락을 사진 내의 다른 정보인 '옛날손짜장'을 읽어내면서 더 똑똑하게 유추하는 모습입니다. 그 다음으로는 웹사이트 검색 및 요약 기능을 테스트해보고자 했습니다. 이전 버젼인 ChatGPT-4도 검색은 가능했지만, 기능 측면에서 아쉬운 점이 있었거든요. 이 질문에 대한 대답 차이는 조금 길어서, 제가 각각 따로 복사해 인용하겠습니다. - ChatGPT-4 윤석열 대통령 취임 2주년 기자회견에 대한 한겨례와 중앙일보의 보도는 각기 다른 내용과 초점을 담고 있어, 이들 언론사의 편집 방향성이 어떻게 다른지를 잘 보여줍니다.한겨례는 채상병 특검법과 김건희 여사와 관련된 논란 등에 대한 대통령의 책임과 투명성을 강조하는 보도를 했습니다. 이 보도는 정치적, 대중적 요구에 대해 윤 대통령이 사과하고 구체적인 조치를 취할 것을 촉구하는 내용을 중점적으로 다루면서, 민감한 사안들에 대한 대통령의 대응을 비판적으로 조명했습니다. 투명하고 반응적인 거버넌스 필요성을 강조하는 태도를 보였습니다.반면, 중앙일보는 지난 2년 간 윤 대통령의 성과와 미래 계획에 초점을 맞추어 긍정적인 보도를 했습니다. 경제 정책, 시장 경제 안정화, 규제 장벽 감소, 그리고 특히 판매 외교 강화와 한미 안보 및 경제 동맹과 같은 국제 외교의 진전을 강조하며, 행정의 방향을 긍정적으로 전망하였습니다.이렇게 한겨례와 중앙일보의 다른 초점은 현재 윤석열 대통령 행정부를 어떻게 해석하고 있는지에 대한 다양한 해석을 보여줍니다. 한겨례는 정치적 및 대중적 압력에 대한 행정의 반응을 검토하고, 중앙일보는 정책 성공과 미래 지향적 전략을 축하합니다. - ChatGPT-4o(옴니) 윤석열 정부의 취임 2주년 기자회견에 대한 한겨레와 중앙일보의 보도를 비교해보겠습니다. 두 언론사의 보도는 각기 다른 시각에서 접근하여 다양한 해석을 제공하고 있습니다. 한겨레의 보도 요약 한겨레는 윤석열 대통령의 기자회견에 대해 비판적인 시각을 유지했습니다. 주요 내용은 다음과 같습니다: 소통 방식에 대한 비판: 한겨레는 윤 대통령의 기자회견이 일방적인 소통 방식에 머무르고 있다고 지적합니다. 기자회견에서 민감한 사안에 대한 명확한 답변을 피한 점을 비판합니다 (한겨레_세상을 보는 눈) (한겨레_세상을 보는 눈). 정책 실효성에 의문: 한겨레는 정부의 주요 정책이 실질적인 문제 해결보다는 형식적인 소통에 그치고 있다고 주장합니다. 특히 경제와 사회 정책에서 나타나는 한계점을 강조합니다 (한겨레_세상을 보는 눈). 사회적 논란: 한겨레는 김건희 여사와 관련된 논란 및 기타 사회적 이슈에 대해 윤 대통령이 충분히 해명하지 않았다고 평가합니다 (한겨레_세상을 보는 눈). 중앙일보의 보도 요약 중앙일보는 윤석열 정부의 성과를 강조하며 긍정적인 평가를 내렸습니다. 주요 내용은 다음과 같습니다: 정책 성과 강조: 중앙일보는 윤석열 대통령이 지난 2년간 경제 성장과 외교 성과를 이루었다고 강조했습니다. 특히 글로벌 중추국가 외교 강화, 경제의 체질 개선, 민간주도 성장 등을 주요 성과로 언급했습니다 (중앙일보) (중앙일보) (중앙일보) (중앙일보) (중앙일보). 미래 계획 발표: 기자회견에서 윤 대통령은 저출생 대응을 위한 기획부 신설, 사회적 약자 지원 강화, 경제적 공정성 제고 등의 미래 계획을 발표했습니다. 중앙일보는 이러한 계획들이 긍정적인 영향을 미칠 것이라고 평가했습니다 (중앙일보) (중앙일보). 김건희 여사 관련 논란에 대한 사과: 중앙일보는 윤 대통령이 김건희 여사와 관련된 논란에 대해 사과한 점을 강조하며, 대통령의 진솔한 태도를 긍정적으로 평가했습니다 (중앙일보). 보도 뉘앙스 차이 한겨레는 윤석열 대통령의 기자회견을 비판적인 시각에서 다루며, 소통 방식과 정책의 실효성에 대한 의문을 제기합니다. 한겨레는 정부의 성과보다는 문제점과 한계를 부각시키며 비판적인 입장을 유지합니다.반면, 중앙일보는 윤석열 정부의 성과를 긍정적으로 평가하며, 기자회견에서 발표된 정책 성과와 미래 계획을 중심으로 보도합니다. 중앙일보는 대통령의 사과와 진솔한 태도를 강조하며 긍정적인 논조를 유지합니다.이처럼 두 언론사는 각각의 시각에서 접근하여 독자들에게 다른 관점을 제공합니다. 윤석열 취임 2주년 기자회견의 내용에 대해 잘 모르는 사람이 봐도 차이를 쉽게 느낄 정도로 ChatGPT-4와 ChatGPT-4o의 검색 및 문서 작성 성능은 큰 차이가 있습니다. 제가 느낀 차이점은 크게 세 가지 입니다. 이전과 다르게, 특정 웹사이트에 직접 들어가 검색하려는 시도를 합니다. 예를 들어 위에 질문을 받았을 때, 이전 모델인 GPT-4는 '윤석열 기자회견 한겨례'라고 검색한다면, GPT-4o는 'hani.co.kr에서 윤석열 기자회견 검색'과 같은 과정을 수행하는 게 보입니다. 물론 이 기능은 테스트해본 결과, 검색을 막아둔 웹사이트들은 진행하지 못합니다. 이전보다 더 다양한 웹사이트를 참고하려고 합니다. GPT-4의 경우 인용한 웹사이트 링크가 여러 개여도 하나의 웹사이트 내에서 여러 내용을 인용하는 경우가 많았다면, GPT-4o은 같은 중앙일보 인용이어도 최대한 다양한 기사를 인용하며 총 5가지 기사에서 정보를 인용했습니다. GPT-4에서 특정 업무를 수행할 때, 요청한 정보나 데이터가 나오는 속도가 사람이 읽는 속도보다 느린 경우가 많았는데, 지금 GPT-4o에게 일을 시키면.. 수행하고 출력하는 속도가 너무 빨라 도저히 제 읽는 속도로 따라갈 수가 없는 정도입니다. 혹시 유료버젼을 쓰고 계신 분들이라면 시도해보세요. 전혀 과장이 아님을 아실 겁니다. 바로 위에 저 내용을 조사한 후 출력하는 데 5초도 안걸렸습니다. 최근 Meta의 오픈소스인 LLaMA-3의 성능이 아주 뛰어나게 출시됐고, Antrophic사의 Claude-3의 성능이 ChatGPT-4보다 좋다는 뉴스가 나오며 OpenAI가 어떤 반격을 준비하고 있나 궁금해하던 사람이 많았을텐데, 역시 OpenAI는 대중을 실망시키지 않았습니다.성능이 정말 많이 뛰어나고, 특히 '인간적인'교감이 가능해진 만큼 AI가 'Her'에 나오는 비서처럼 유능할 수도 있고, 'Her'에 나오는 것 처럼 AI가 가진 여러 문제점 역시 더 가시화될 수도 있습니다. 이런 내용들은 추후 다른 글로 천천히 다뤄보겠습니다.

2024.05.14

·

·

AI 윤리 레터

184

세상에서 가장 유명한 윤리 딜레마

세상에서 가장 유명한 윤리 딜레마 by. 🥨 채원 이런 밈을 보신 적 있으실까요? 단연코 현 시대에 가장 널리 알려진 윤리적 딜레마가 아닐까 싶은 트롤리 딜레마(광차 문제)입니다. 트롤리의 딜레마는 영국의 철학자인 필리파 풋 (Philippa Foot)에 의해 고안된 윤리학의 사고 실험으로, 1967년에 출간된 <낙태의 문제와 이중 효과 원칙 (“The Problem of Abortion and the Doctrine of Double Effect”)>에서 처음 소개되었습니다. 낙태 문제를 탐구하기 위해 들었던 예시인 이 사고 실험은, 이후에 수많은 윤리 문제를 연구에 사용되어왔습니다. 특히 자율 주행 차량의 윤리학을 다룬 모럴 머신 실험 (The Moral Machine Experiment)에 사용되어 AI 윤리에서도 널리 논의되어 왔죠. 모럴 머신은 온라인에서 누구나 참여할 수 있는 실험으로, 자율 주행 자동차가 직면한 다양한 도덕적 딜레마를 탐구합니다. 출시된 이래 233개국 이상, 4천만 건 이상의 결정을 모으며 꾸준한 관심을 받고 있습니다. 모럴 머신 실험은 2018년 네이처지에 실린 논문을 비롯하여 다양한 학술적 성과를 이루어냈습니다. 이러한 성공과 더불어, 트롤리 딜레마의 한계도 지적되고 있습니다. 트롤리 딜레마는 조금씩 변형하여 다양한 도덕적 의사 결정을 내리는 사고 실험을 하는 데 유용하긴 하지만, 한편으로는 AI 윤리의 논의대상을 물리적이고 기계적인 문제들로 제한한다는 것입니다. 베르겐 대학교의 마리야 슬라브코빅(Marija Slavkovik)과 같은 학자는 이러한 한계는 예컨데 온라인 상 콘텐츠 검열과 같이 정해진 수의 보기가 명확하게 없는 문제에서 극명한 한계를 보인다고 비판합니다. 두 가지 결정 중에 반드시 하나를 선택해야만 하는 이분법적인 접근을 요하는 트롤리 딜레마와 달리, 콘텐츠 검열의 경우 복잡한 스케일 안에서 미묘한 차이에 기반한 다양한 선택 중 하나를 결정해야 하는 경우가 대부분입니다. 예컨대 같은 아동의 사진이라도 아동을 대상으로 하는 성착취물와 전쟁의 참사를 드러내는 사진은 명백히 다른 함의를 가진다는 거죠. 복잡한 사회적 맥락을 고려하지 않고 기계적인 이분법적 잣대를 바탕으로 내리는 의사 결정에는 근본적인 한계가 존재할 수 밖에 없습니다. AI 윤리, 기계 윤리, 데이터 윤리 등 다양한 이름으로, 새로운 기술이 사회에 미치는 영향과 거기서 파생되는 새로운 문제들이 탐구되고 있습니다. 모럴 머신 실험은 한국에서도 AI 윤리 교육에 활용되는 등 활발하게 다루어져왔습니다. 다만 AI 윤리의 문제가 모두 트롤리의 딜레마로 치환될 수 없다는 점은 명심해야 할 것입니다. 혹시나 궁금하실 분들을 위해, 지난주 베를린에서 열린 2024년 기계+행동 학회 (Machine+Behaviour Conference) 중, <기계 윤리 예시: 앞으로 나아가기 (”Machine Ethics Examples: Moving Forward”)>라는 제목으로 마리야 슬라코빅 교수가 발표한 내용은 여기에서 다시 볼 수 있습니다. 신뢰 : AI가 살아남기 위한 조건 by. 🍊산디 막스 베버는 <직업으로서의 학문>에서 공학자가 아닌 일반인이 어떻게 자동차를 신뢰할 수 있는지 이야기합니다. 그는 자동차의 작동 방식을 알지 못하더라도 “원하기만 하면 언제든 ‘배울 수 있다’고 알고 있거나 또는 그렇게 믿고”있기 때문에 자동차를 신뢰할 수 있다고 생각했습니다. 자동차는 신비한 힘이 아니라 계산 가능한, 통달할 수 있는, 탈주술화되어 있는 도구죠. 베버의 관점에서 본다면, 일반인에게 AI는 신뢰할 수 없는 기술입니다. 미지의 ‘블랙박스’로서 AI는 이해할 수 없는, 주술과 같은 영역이기 때문이죠. AI의 탈주술화를 위해 전 세계 연구자들이 연구에 박차를 가하고 있습니다. 의사결정 과정과 이유를 설명할 수 있는 AI(explainable AI), 인간 윤리를 학습한 AI를 개발하려는 노력이 이루어지고 있죠. 이러한 공학적 접근은 AI 자체가 투명하고 윤리적이어야 신뢰할 수 있다는 관점에 입각합니다. AI 자체를 개선하려는 접근은 분명 AI의 신뢰 가능성을 높이는 데 도움이 됩니다. 하지만 기술 자체의 속성만으로 신뢰 가능성이 결정되지는 않습니다. 신뢰는 사회적 실체이기 때문이죠. 기술적으로 완벽하지만 사회적으로 믿을 수 없는 기술이 있을 수 있습니다. 반대로 엉성하다 못해 복장 터지는 기술임에도 불구하고 신뢰받는 경우도 많죠. 자동차 사례로 돌아가봅시다. 저는 자동차의 작동 방식에 별 관심이 없습니다. 그럼에도 불구하고 제가 특정 자동차 모델을 구매하기로 결정했다면 이는 1) 다른 사람들도 해당 자동차 모델을 구매했고, 2) 자동차를 제조한 기업의 과거 행동과 평판에 대해 알고 있고, 3) 자동차를 규제하는 법 제도가 존재함을 알기 때문일 것입니다. 사진: Unsplash의 Jason Leung AI 역시 마찬가지입니다. 인간-AI 상호작용에서 AI를 신뢰할 수 있는지에 대한 판단은 다른 사람도 해당 AI를 사용하는지, AI 제조사를 믿을 수 있는지, AI에 대한 법 제도적 장치가 마련되어 있는지와 같은 AI를 둘러싼 사회적 맥락을 함께 고려하여 이루어집니다. 인간의 윤리를 완전히 학습했다고 주장하는 ‘궁극의 AI'가 혹시라도 가능하고, 또한 등장할 수 있다 하더라도, 그것의 신뢰 가능성은 기술력에 의해 결정되지 않습니다. 사람들은 AI 기업이 어떤 노력을 보여주었는지, 이용자들과는 어떤 관계를 맺고 있는지, 관련 법제도의 정비 수준은 어떠한지를 따져 물을 거예요. 만약 신뢰할 수 없다면, ‘궁극의 AI’는 역사에서 사라질 겁니다. 이용자의 신뢰를 얻을 수 있는 AI가 인류와 함께 살아 남을 것입니다. 이것이 기업과 정부가 AI 윤리를 적극적으로 이야기해야 하는 이유입니다. 오늘 이야기 어떠셨나요? 여러분의 유머와 용기, 따뜻함이 담긴 생각을 자유롭게 남겨주세요. 남겨주신 의견은 추려내어 다음 AI 윤리 레터에서 함께 나눕니다.

2024.05.09

·

·

AI 윤리 레터

47

인간과 인공지능 행위자의 적절한 관계

AI 윤리 뉴스 브리프 2024년 5월 둘째 주 by 🤔어쪈 1. AI가 읽는 AI가 쓴 자소서 어떤 내용의 글이든 막힘없이 휘뚜루마뚜루 써내는 생성형 AI 기술이 알게 모르게 깊이 침투한 곳이 있습니다. 바로 채용 시장입니다. 구직자 입장에서 구인 공고에 맞춰 수없이 많은 지원서를 써야 하는 번거로움을 줄여주니 마다할 리 없지요. 덕분에 기업들은 지원자 수가 훨씬 증가했다고 합니다. 이는 사람을 구하는 회사 입장에서 꼭 좋은 일만은 아닙니다. 서류 심사 대상이 많아진 만큼 검토 업무가 늘어났고, 심지어 지원서에 적은 내용을 면접에서 확인할 수 없는 경우도 종종 발생하고 있습니다. 때문에 생성형 AI로 작성한 서류를 탐지하기 위한 AI를 도입하는 중이죠. 한 국내 기업은 작년 하반기 자사 AI 서류평가 솔루션으로 분석한 약 27만 건의 자기소개서 중 11% 이상이 ‘챗GPT를 표절했다고’ 주장합니다. 95%의 정확도를 자랑하지만 22%의 오탐지율은 분명 낮은 수치가 아닐텐데요. 특히 오탐지된 지원서를 기업이 그대로 불합격 처리할 경우, 지원자 입장에서는 공들여 쓴 서류가 단지 AI가 썼다고 의심된다는 이유만으로 탈락하는 상황이 발생할 수 있습니다. 생산성을 높인다는 명목으로 도입한 AI지만 생산성 증대는 커녕 애먼 피해자만 속출하는 것은 아닐까 우려됩니다. 🦜더 읽어보기 교수님, 정말 AI가 아니라 제가 직접 썼습니다..! (2023-09-04) 뉴욕시, 세계 최초 채용 AI 규제 (2023-07-10) 2. (미국이 뽑은) 생성형 AI의 12가지 그림자 여러모로 미국의 AI 정책의 열쇠를 쥐고 있는 NIST (미 국립표준연구소) 에서 AI에 대한 4개 문서를 연달아 발표했습니다: 1) AI 위험 관리 프레임워크의 생성형 AI 프로파일; 2) 생성형 AI 및 파운데이션 모델의 안전한 소프트웨어 개발 프레임워크; 3) 합성 콘텐츠의 위험 완화 방안; 4) 글로벌 AI 표준 논의 참여 방안. 모두 작년 백악관이 발표한 AI 정책 행정명령의 후속 조치로, 미국 정부는 NIST에 AI 안전성, 보안성, 신뢰성 확보를 위한 가이드라인과 표준, 우수 사례 마련을 맡긴 바 있습니다. 이 중 첫번째 문서를 좀 더 살펴볼까요. 위험 기반 접근법 (risk based approach) 이 사실상 AI 규제의 방법론적 기준으로 자리잡으면서 AI의 위험을 어떻게 평가할 것인지가 관건이 되었습니다. 미국은 일찌감치 NIST에서 AI 위험 관리 프레임워크(Risk Management Framework; AI RMF)를 만들어 국제 표준을 제시하려고 하는 중이죠. 이번에 발표한 ‘생성형 AI 프로파일’은 AI RMF를 AI의 하위 분류 기술에 적용한 첫 사례 보고서입니다. 해당 문서에서 식별한 생성형 AI의 12개 주요 위험(허위 정보 및 유해 콘텐츠 생성, 프라이버시 및 지적재산권 침해 등)은 대부분 우리에게 익숙한 것들이지만, 첫번째로 화생방 및 핵무기 정보 제공 문제를 앞세운 것은 눈에 띱니다. 또한 NIST가 여러 종류의 위험을 어떻게 구분했는지, 또 해당 위험 완화를 위해서 어떤 조치가 필요하다고 언급하는지 미리 살펴보는 것만으로도 향후 AI 규제와 표준이 어떻게 자리잡을 지 예상해 볼 수 있을 것으로 보입니다. 3. AI 에이전트를 쓰고 싶지만, 대하고 싶진 않다면? 현재 AI 업계에서 가장 뜨거운 키워드를 고르라면 단연 ‘AI 에이전트 (agent)’일 겁니다. 최근 오픈AI CEO 샘 알트만 역시 최근 인터뷰에서 완성도 높은 AI 에이전트가 킬러 앱이 될 것이라고 언급했듯, 많은 기업이 생성형 AI 기술을 앞세워 AI 에이전트 개발에 여념이 없습니다. 하지만 소셜미디어의 봇 계정, 게임의 NPC (비플레이어 캐릭터), 고객센터의 ARS (자동응답시스템) 를 떠올려보면 AI 에이전트는 사실 새로운 것이 아닙니다. AI 에이전트는 지능형 또는 생성형 ‘행위자’로 직역되기도 하는데, 이는 곧 사람이 할법한 말과 행동을 대신할 수 있다는 의미를 함축합니다. 많은 AI 회사가 ‘당신이 [더 중요한 일]에 집중할 수 있도록 [특정 행위]는 AI에게 맡기세요’라고 속삭이고, AI 에이전트의 사용자에게 이는 분명 솔깃한 제안입니다. 하지만 기업도 사용자도 놓치기 쉬운 부분은 그 [특정 행위]가 AI 에이전트를 직접 마주할 다른 사람들에게는 [더 중요한 일]일 수 있다는 사실입니다. 🦜더 읽어보기 참을 수 없는 목소리의 가벼움 [전치형의 과학 언저리] (한겨례, 2024.05.02) 4. 더 이상 실존하지 않는 인류의 실존 위협 연구소 우리에겐 <슈퍼인텔리전스 (Superintelligence)>라는 책 저자로 유명한 닉 보스트롬(Nick Bostrom)이 이끌던 옥스포드 인류미래연구소 (Future of Humanity Institute, 이하 FHI) 가 문을 닫았습니다. 19년간 명맥을 이어온 것에 비해 다소 조용한 마지막이었습니다. 기존 홈페이지는 종료 안내와 검색창만 남긴 채 사라졌고, 조촐한 아카이빙 웹사이트만 남았습니다. FHI는 철학과 소속이었지만 특정 학문 분과보다는 비슷한 사상, 특히 효과적 이타주의 (effective altruism) 나 장기주의 (longtermism) 에 기반한 연구소였습니다. 연구소장 닉 보스트롬의 초지능 담론을 비롯한 인류에 대한 실존적/파국적 위험 (existential-catastrophic risk) 이나 인간증강 (human enhancement) 과 같은 주제를 비교적 일찍이 다뤄왔고, 특히 실리콘밸리의 주목과 후원 아래 초지능 내지는 AGI (인공일반지능) 의 위험 담론을 주도해왔습니다. 때문에 FHI에서 태동한 사상은 현재의 AI 안전과 AI 거버넌스라는 이름으로 AI 윤리 논의에 적잖은 영향을 미치고 있습니다. 하지만 AI 윤리 레터에서도 초기부터 지적해왔듯, 그 추종자들이 당장의 AI 기술이 가진 문제점 대신 먼 미래에 대한 사고실험에만 관심과 자원을 쏟도록 유도하고 있어 주의해야 합니다. FHI의 유산에 대해 비판적인 평가가 필요한 이유입니다. 🦜소식 그.래.서! 이번 5월 21일(화)부터 AI 윤리 북클럽은 <AGI 담론 비판>을 주제로 시즌 2를 진행합니다. AI 윤리 레터를 통해 종종 읽은 글과 논의한 내용을 전해볼게요! 오늘 이야기 어떠셨나요? 여러분의 유머와 용기, 따뜻함이 담긴 생각을 자유롭게 남겨주세요. 남겨주신 의견은 추려내어 다음 AI 윤리 레터에서 함께 나눕니다.

2024.05.07

·

·

AI 윤리 레터

231

혹시라도 뉴스를 읽다가 지쳐버릴까봐서!

뉴스를 읽다가 지쳐버릴까봐 쓰는 글 by. 🍊산디 AI 디지털 교과서 도입에 대한 MBC의 [집중취재]가 눈에 띄어 기대를 품고 읽기 시작했습니다. 🦜AI 윤리 레터에서도 소개된 바 있는 있는 이슈이지요. 이주호 교육부총리가 “우려를 충분히 잘 제어하면서 진행하면 전세계적으로 주목받을 것”이라고 말한 정책이기도 합니다. 초등학생을 대상으로 시행되는 AI 정책입니다. 무엇을 보호해야 하며 어떻게 보호할 수 있는지 더 많은 고민과 논의가 필요한 분야죠. [집중취재]라고 하여 그간 미진했던 논의들을 살펴보는 보도일거라 기대했지만, 아니었습니다. 빛나는 미래가 성큼 다가온 듯한 교실이 그려졌을 뿐, 학생들의 정보인권과 AI 디지털 교과서가 미칠 영향은 다루어지지 않았습니다. 다른 지면을 빌려 다루기도 했습니다만, AI 디지털 교과서에 대해 따져 물어야 할 질문이 참 많습니다. UNESCO의 <인공지능과 교육-정책입안자를 위한 지침>은 마침 교육 분야에 AI를 적용할 때 어떤 질문들을 따져보아야 하는지 다음과 같이 친절히 안내합니다. 학습 데이터를 윤리적으로 수집 및 활용할 수 있는 경계는 어디까지인가? 그 기준은 무엇인가? 학교, 학생, 교사가 데이터 수집을 거부하거나 대항할 수 있는 방법은 무엇인가? 인공지능의 처리 결과를 쉽게 알 수 없다는 것은 어떤 의미인가? 기업과 공공기관은 어떤 윤리적 의무를 지는가? 학생들의 일시적인 흥미, 감정과 학습 과정의 복잡성을 고려했을 때 인공지능은 어떠해야 하는가? 사진: Unsplash의Good Good Good AI 디지털 교과서를 담당하는 공무원과 교사, 기업 관계자 분들이 위 질문에 대한 답을 가지고 있는 것일까요? 설령 나름의 해법을 가지고 있다 하더라도 그 내용은 학부모와 학생들에게 공유되어야 마땅합니다. 만약 답을 찾아가고 있는 과정에 있다면, 그 과정 또한 공유되어야 합니다. 질문과 해법을 찾아가는 과정을 공개하는 것이 언론의 역할입니다. 많은 언론 보도는 AI가 가져올 경쾌한 미래를 그리는 데에 초점을 맞춥니다. 정부나 기업의 보도자료를 그대로 전하거나, 기술의 장점만을 부각하여 전하는 보도는 굳이 인용하지 않아도 숱하게 찾아볼 수 있습니다. 하지만 모든 보도가 AI 디지털 교과서에 관해 아무것도 묻지 않는 것은 아닙니다. 그리고 저는 제 역할을 해낸 보도에 더 많은 조명이 비추어져야 한다고 생각해요. 다음은 AI 디지털 교과서를 비판적으로 다룬 보도들 중 일부입니다. 국민일보는 교과서의 데이터가 엄밀히는 사교육업체에게 제공되며, 교육청 관계자들 사이에서도 이견이 있고, 의견수렴이 미진함을 지적합니다. 교과서 이용에 “동의하지 않는 학생의 수업을 어떻게 할 지는 검토해보지 않았다”는 교육부 관계자 인터뷰 내용을 인용하기도 했습니다. 경향신문은 AI 디지털 교과서 정책이 알고리즘 편향을 비롯해 AI 사용 시 발생하는 윤리적 쟁점을 충분히 다루지 않은 채 ‘속도전’을 치르고 있음을 비판했습니다. AI 디지털 교과서 도입에 대한 7명의 교사의 의견을 인터뷰한 내용을 소개하기도 했습니다. IT 조선은 AI 디지털 교과서가 클라우드 컴퓨팅 보안인증에서 난항을 겪고 있다는 사실과 함께 장애, 다문화, 기초학력 등 학생들의 다양한 특성을 고려한 보편적 학습설계도 중요한 문제가 될 것임을 지적합니다. [집중취재] 보도가 있었던 바로 다음날, MBC 역시 AI 디지털 교과서가 문해력을 해칠 수 있다는 우려의 목소리를 전했습니다. 이외에도 많은 언론인들이 문제의식을 안고 해당 이슈에 접근하고 있을 것입니다. 제가 소개해드리지 못한 보도도 많구요. 그러니 한국 언론인들은 문제의식이 없다고 비판하는 게 아니라, 언론 조직의 의사결정 과정과 보도 구성의 논리를 어떻게 개선할 수 있을지 고민해야 합니다. AI와 같은 기술을 다루기 위한 내부적인 가이드라인이 도움이 될 수 있을 겁니다. 만약 AI 보도 가이드라인을 논의하게 된다면 🦜AI 윤리 레터가 제시했던 ☑️ AI 하이프 뉴스 체크리스트가 도움이 되었으면 합니다. 퓰리처 재단이 ‘인공지능을 취재하는 언론인을 위한 스포트라이트 시리즈’에서 이야기하는 것처럼, 언론 또한 AI를 공개, 조사, 설명하는 책임을 집니다. 비단 AI 디지털 교과서뿐만 아니라 기술 정책 이슈를 다루는 과정이 보다 풍성한 물음으로 가득차기를 간절히 바랍니다. 🦜함께 읽으면 좋을 글 AI 교과서는 우리 아이 데이터 채굴기?(2024-01-29) 외부인의 'AI 디지털교과서' 단상(2024-02-21) 우주 정복과 영생의 꿈은 TBC! by. 💂죠셉 오늘 레터는 작년 여름 무렵부터 테크 커뮤니티에서 언급되기 시작한 화제의 단어로 시작해 보려 합니다. 바로 TESCREAL (‘테스크리얼')인데요. 저희 레터에서도 종종 언급되는 AI 윤리학자인 팀닛 게브루와 에밀 토레스가 처음 만들고 홍보해 온 이 단어는 Transhumanism (초인간주의), Extropianism (무한생명주의), Singularitarianism (특이점주의), Cosmism (우주론), Rationalism (합리론), Effective Altruism (효과적 이타주의), Long-termism (장기주의)라는 일곱 개의 이념을 통칭합니다. (*💂 각 개념을 설명/이해하는 게 오늘 레터의 목적은 아니니 링크 첨부로 대신합니다.) AI 윤리의 관점에서 TESCREAL이 흥미로운 이유는, 테크 업계의 거물들이 AI에 대해 취해온 입장에 대해 중요한 문제 하나를 지적하고 있기 때문입니다. 왜 그들은 특이점과 초지능의 등장으로 인한 인류 멸망 시나리오에 대해서는 열정적으로 발언하면서 정작 AI의 편향성과 환경문제와 같은 ‘당장 직면한 문제들’에 대해서는 침묵하는 걸까요? 게브루/토레스는 일론 머스크와 샘 올트먼을 비롯한 테크-유토피아 주의자 중 상당수가 사상적으로 TESCREAL 진영에 속해있다는 점을 지적함으로써 이에 대한 흥미로운 대답을 내놨습니다. 이렇게 설명해 볼게요. “머지않은 미래에 인간은 기계와의 결합을 통해 강화(enhanced)된 영생을 얻고, 수 조명의 ‘디지털 시민'들이 살 수 있는 가상 세계의 시민으로 살게 될 것이며, 나아가 우주 전체를 식민화(colonise)시켜 그곳을 무대로 무한히 뻗어나갈 것’이라는 믿음을 가진 사람을 만났습니다. 이런 이야기를 여러분께선 어떻게 받아들이실 것 같나요? 예상하셨겠지만 위 내용은 게브루/토레스에 의해 ‘TESCREAL 주의자들’로 언급된 사람들이 그리는 미래의 축약본입니다. SF 소설 혹은 음모론 같다고 생각할 수 있겠지만, 오래전부터 아주 많은 인터뷰를 통해 공개적으로 밝혀온 바 있죠. 인물 별로 조금씩 편차는 있지만, 머스크와 올트먼 뿐만 아니라 ‘초지능(super-intelligence)' 내러티브의 창시자인 닉 보스트롬, 그리고 ‘라이프 3.0’으로 명성으로 막스 테그마크 등이 지속해서 밝혀온 입장과도 접점이 있습니다. 범용 인공 지능 (AGI) 이들이 그리는 미래의 중심에는 AGI(Artificial General Intelligence, 범용 인공 지능)이 있습니다. AGI는 일반적으로는 ‘인간이 할 수 있는 어떤 지적인 업무도 수행할 수 있는 AI’로 정의됩니다. ‘범용'이라는 단어에서 알 수 있듯 그 활용 방법이 무궁무진할 것이므로 오픈AI를 비롯한 많은 이들이 공개적으로 지향하고 있는 업계의 ‘성배'와 같죠. 요즘 밈처럼 사용되는 ‘특이점'은 바로 AGI가 ‘초지능’의 수준에 이르러 인류에게 폭발적 지적 혁명을 가져오는 시점을 뜻합니다. 앞서 언급된 영생을 얻는 신인류, 가상 세계, 우주로의 진출 등 지금 인류의 지능으로는 불가능한 목표도 초지능의 출현과 함께 가능해진다는 것이죠. 게브루/토레스의 지적에 따르면 TESCREAL 주의자들은 위와 같은 초지능의 출현을 필연으로 상정한다는 공통점이 있습니다. 더 나아가 그 정도 지적 수준을 갖춘 AI가 만약 인간의 가치 및 세계관과 일치를 이루지 못했다면 어떤 참사가 일어날까? 라는 질문을 던짐으로서 아젠다를 선점하고 있다는 것이죠. 같은 ‘AI safety’를 이야기하지만 실상 바라보고 있는 곳은 현재가 아닌 먼 미래인 샘입니다. 이게 왜 문제라는 걸까요? 일단 AGI라는 목표 설정 자체의 문제가 있습니다. 실현 가능성이 확인되지 않은 AGI에 대한 ‘믿음'을 ‘필연’처럼 홍보하며 회사의 가치를 올리려는 시도도 문제지만, 게브루/토레스는 그 개발 과정에 있어 제대로 된 테스트가 불가능하다는 점을 지적합니다. 활용 가능한 케이스가 무한하다는 것은 반대로 말해 안전을 위한 검증이 필요한 경우의 수도 무한하다는 의미겠죠. 같은 맥락에서 AGI에 대한 이들의 비젼은 ‘과학적'일 수도 없다는 것입니다. 예측 불가능한 신적 영역을 목표로 할 게 아니라, 일단 테스트 해야 하는 경우의 수가 유한한, 한정된 범위의 업무만을 수행하는 ‘좁은 (Narrow) AI’ 개발을 우선으로 할 것을 제안하고 있습니다. 또 다른 문제는, 이들의 종말론적 비전이 현재 당면한 문제를 놓치게 한다는 지적입니다. 대표적으로 AI 모델을 구축하고 가동하기 위해 소비되는 막대한 에너지와 환경 문제가 언급되는데요. TESCREAL의 핵심 인물 격으로 지목된 닉 보스트롬과의 그간 주장을 요약한 다음 부분을 살펴보면 TESCREAL의 마지막 두 축인 ‘효과적 이타주의’와 ‘롱터미즘'이 그들의 비전에 어떤 사상적 근거를 제공하고 있는지 알 수 있습니다. "TESCREAL 주의의 관점에서 보면 ‘한계가 없는 지성’을 만들기 위해 투입되는 막대한 자원과 같은 환경문제도 AGI라는 유토피아의 가능성 앞에서 정당화될 수 있다. 보스트롬을 인용하자면 단기간의 ‘대규모 인간 학살마저도 우주로 나아갈 인간의 거대하고 영광스러운 미래를 생각하면 인류를 위한 작은 한 걸음'일 뿐이기 때문’이다." (*💂 효과적 이타주의는 공리주의 관점에서 다수에게 이득이 되는 결정을 내려야 한다고 말합니다. 롱터미즘도 마찬가지로 공리주의 관점에서 우리는 먼 미래의 신인류에 대한 도덕적 책임이 있다는 점을 강조하고요. 이렇게 둘을 포개면 현재의 인류가 손해를 보더라도 먼 미래를 위한 선택을 해야 할 당위성이 만들어집니다.) To infinity... and beyond? 지속 가능성과 기술 윤리를 '거짓말'로 규정하며 '유일한 가치는 무한한 성장뿐이다'라고 외쳤던 실리콘 밸리의 거물, 마크 엔드리슨의 테크-유토피아 선언문이 떠오르는 대목입니다. 이런 관점에서 보면 AI를 발판 삼아 영생과 우주라는 무한의 세계로 향하는 TESCREAL의 지향점은 그들의 논리적 귀결로서 자연스러워 보입니다. 하지만 우리의 일상과는 너무나 동떨어진 이 이야기를 마냥 무시할 수 없는 이유는, 그들이 오늘 우리 삶에 가장 큰 영향을 끼치는 기술을 선도하는 리더들이고, 실제로 그 미래에 초석이 될 사업을 조금씩 현실화 시켜나가고 있기 때문일 겁니다. (추신: 사실 게브루/토레스가 발표한 내용의 핵심은 TESCREAL의 뿌리에 우생학이 있다는 주장입니다. 우생학은 아우슈비츠 학살의 당위성을 나치에게 제공한 문제적 사상이자 유사 과학이죠. 그 사상적 뿌리로 인해 알고리즘이 가진 인종 차별과 소외 그룹에 대한 차별의 문제를 대수롭지 않게 여긴다는 점 또한 지적됐지만 지면상 생략했습니다.) 🦜함께 읽으면 좋을 글 AGI vs. 현실 (🦜AI 윤리 레터 2023-05-29) 오늘 이야기 어떠셨나요?여러분의 유머와 용기, 따뜻함이 담긴 생각을 자유롭게 남겨주세요.남겨주신 의견은 추려내어 다음 AI 윤리 레터에서 함께 나눕니다.

2024.05.03

·

·

AI 윤리 레터

135

탈세계화 시대의 AI

AI 윤리 뉴스 브리프 2024년 4월 다섯째 주 by 🧙‍♂️텍스 1. 원격 계산원과 키오스크 글로벌 아웃소싱은 어제오늘의 일이 아닙니다만, 정보기술의 발전과 함께 다양한 형태로 다양하게 변화하고 있습니다. 최근 뉴욕타임스는 원격 계산원을 도입하여 오프라인에서 아웃소싱한 뉴욕 레스토랑의 사례를 다루었습니다. 그동안 🦜AI 윤리 레터에서 다루었던 온라인 아웃소싱에서 한 발 더 나간 모습이네요. 가게 소재지인 뉴욕 퀸스의 롱아일랜드 시티 최저임금은 시간당 $15인 반면, 필리핀에 거주 중인 원격 계산원은 $3의 임금을 받습니다. 최저 임금 관련 법률이 주에 물리적으로 위치한 사람에게만 적용되기 때문에 가능한 임금 차별이죠. 리처드 볼드윈의 저서 Globotics Upheaval (2019)에서는 세계화와 로보틱스의 결합을 globotics (globalization + robotics)로 정의하고 세계화가 단순히 재화와 상품의 교환에서 벗어나서 원격이주(telemigration)의 형태로 확장되어 간다는 예측을 하기도 했습니다. 원격 계산원의 사례도 위와 같은 원격이주의 한 형태로 볼 수 있을 듯하네요. 원격 계산원은 줌의 가상 접객원(virtual receptionist) 플랫폼 기반으로 구현이 되어 있는 것으로 보입니다. CNBC의 2021년 기사에 따르면, 줌은 코로나-19 이후 줌을 통한 화상회의 수요가 줄어들 것을 대비하면서 가상 접객원 기능을 이미 준비해 두었다고 하네요. 가상 접객원 시스템의 특성상 목적에 부합하는 데이터 취득이 용이하기 때문에 미래에는 가상 아바타와 거대언어모델을 조합한 알고리즘으로 아웃소싱 업무 자체도 완전히 대체되지 않을까 조심히 예측해 봅니다. 반면, 한국의 경우는 언어 때문인지 제3국으로의 아웃소싱보다는 기술에 전적으로 의존하는 노동 대체가 일어날 것으로 예상됩니다. 이는 종업원 고용을 대체할 수 있는 기술 및 로봇에 크게 투자가 몰리고 있는 사실로 확인할 수 있습니다. 특히 한국 테이블 오더 시장의 65%를 차지하고 있는 티오더는 최근 300억 규모의 추가 투자를 받았습니다. 더 읽어보기 강화학습이 강화하는 역사 (2024-04-24) "세계 최초 윤리적 데이터 회사"는 어떤 모습일까? (2023-08-07) 2. 탈세계화 시대의 플랫폼 1: 틱톡(Tik Tok) 금지 법안 통과 최근 미국 의회 하원(4월 21일)과 상원(4월 23일)은 조건부 틱톡 금지 법안을 통과시켰습니다. 틱톡의 모회사 바이트댄스 지분을 1년 내에 매각하지 않으면 미국에서 틱톡을 금지한다는 법안입니다. 이 법안은 우크라이나, 이스라엘, 대만의 경제적 지원을 위한 법안과 함께 통과하였습니다. 틱톡은 이에 즉각 반발하는 성명을 냈습니다. 틱톡은 위헌적 금지(unconstitutional ban)라면서 미국에 미국 내 데이터의 안전과 외부로부터의 악의적인 영향 및 조작을 막기 위해서 데이터 거버넌스에 많은 투자를 진행해 왔다는 사실을 언급했습니다. 양당 대다수 의원의 동의 입장과 달리, 트럼프 전 대통령은 틱톡 금지가 메타에게 큰 이득을 줄 것이라며 반대하고 있네요. 논쟁의 배경을 이해하기 위해서는 2020년 9월로 거슬러 올라가야 합니다. 당시 트럼프 정부는 중국 정부가 틱톡의 데이터를 훔쳐볼 수 있다며 문제를 제기했고, 미국계가 50% 이상의 지분을 갖는 틱톡글로벌을 세우는 골자로 대략적인 합의가 진행되었습니다. 하지만 2020년 11월 미국 대선이 끝나면서 관련 이슈는 마무리되지 못한 채 바이든 정부의 몫으로 넘어갔습니다. 데이터 거버넌스의 해결을 위해 틱톡은 2022년 3월 중국 서버의 데이터를 모두 미국 내 오라클 클라우드로 이전하는 계약을 체결했습니다. 하지만 여전히 미국의 데이터에 중국 엔지니어가 접근할 수 있다는 사실이 2022년 6월 보도되면서 논란은 이어졌고, 미국 의회는 2022년 12월 정부 기관의 기기에서 틱톡 사용을 금지하는 법안을 제출했습니다. 틱톡은 지분구조의 변화가 데이터 거버넌스와 안보 문제를 해결하지 않는다며, 외부 개입이 없는 데이터 거버넌스를 위한 지속적인 투자를 이야기하고 있습니다. 하지만 틱톡이 어떤 기술과 방법을 동원하든, 중국 공산당이 틱톡에 접근하지 못한다는 사실을 설득하기는 어려워 보입니다. 더 읽어보기 틱톡을 금지하라! (2023-05-22) 3. 탈세계화 시대의 플랫폼 2: 일본 라인(Line) 지분 매각 권고 라인 메신저 운영사 라인야후의 지분구조 일본 정부가 라인 메신저를 운영하는 라인야후에 네이버 지분 매각을 권고했습니다. 틱톡의 사례와 마찬가지로 ‘글로벌 플랫폼 산업’이 실제로는 특정 국가의 통치권을 벗어날 순 없다는 사실을 보여줍니다. 라인 메신저는 월간 활성 사용자 수가 9600만 명에 달하는 일본 내 1위 메신저로, 한국의 카카오톡과 유사한 위상을 점하고 있습니다. 단순히 개인 간의 메신저를 넘어서 정부에서도 라인을 사용할 정도죠. 일부 집단에서는 일본의 주요 메신저를 한국 기업이 소유하고 있다는 사실에 예민하게 반응한다고 합니다. 작년 10월 한국 네이버 클라우드를 통해서 일본 라인의 해킹이 있었고, 이로 인해 라인 이용자, 거래처, 네이버 직원 등의 51만 건의 개인 정보 유출이 있었습니다. 일본 총무성은 이에 대한 사고 재발 방지의 일환으로 라인야후에게 두 차례 행정지도를 내렸으며, 여기에는 보안 거버넌스 개선방안을 위한 네이버에 대한 업무 위탁 및 네이버와의 자본관계 재검토도 포함되어 있습니다. 라인 메신저 사례는 플랫폼과 국가 안보 문제가 결합했다는 점에서 틱톡의 사례와 결을 같이 합니다. 우리나라 외교부는 “우리 기업에 대한 차별적 조치가 있어서는 안 된다”는 입장을 표했죠. 거대언어모델 개발과 활용을 주도하는 미국 빅테크 기업들에 대항하기 위해서, 각 지역의 선도 기업들은 자국에서 소버린 (sovereign) AI의 필요성을 주장하고 있습니다. 네이버도 소버린 AI를 주창하면서 한국 고유 거대언어모델의 필요성을 이야기하고 있죠. 시대의 조류가 탈세계화라면, 네이버에도 국가 내부를 향하는 소버린 AI를 넘는 담론 아이디어가 있어야 라인의 지분을 지키기 유리할 것으로 보입니다. 💬🦜소식 LG AI연구원 AI 윤리 분야 정책 연구 직원 채용 오늘 이야기 어떠셨나요?여러분의 유머와 용기, 따뜻함이 담긴 생각을 자유롭게 남겨주세요.남겨주신 의견은 추려내어 다음 AI 윤리 레터에서 함께 나눕니다.

2024.04.30

·

·

AI 윤리 레터

132

오래된 미래의 AI

더 나은 AI를 위한 상상 by. 💂죠셉 어떤 계기로 <AI 윤리 레터>를 구독하게 되셨나요? 원래 AI와 관련된 분야에 종사하고 계셨을 수도 있지만, 많은 경우는 2022년 11월 출시된 챗GPT 이후로 본격적인 관심을 가지게 되시지 않았을까 합니다. 잘 아시다시피 챗GPT와 같은 챗봇들은 ‘LLM(거대 언어 모델)’을 기반으로 작동하는데요. 이후 클로드(Claude), 제미나이(Gemini)등 LLM 챗봇들이 쏟아져 나오면서 요즘 미디어에서 언급되는 ‘AI’는 사실상 ‘LLM’과 동의어처럼 사용되고 있습니다. LLM이 현재 AI 산업을 이끌어가는 패러다임인 건 분명한 사실입니다. 하지만 LLM은 인간 뇌의 작동 방식을 모방한 신경망(Neural network)을 바탕으로 하고, 이 신경망 기술이 인공지능이라는 목표에 이르기 위한 여러 방법론 중 하나란 사실은 짚고 넘어갈 필요가 있습니다. LLM은(=하위개념) AI지만(=상위개념) 그 반대는 불완전한 설명이라는 것이죠. 오늘 레터에서는 이게 왜 윤리 이슈 관점에서도 흥미로운 지점인지 짧게 다뤄보도록 할게요. 뉴로..심볼릭..? AI와 LLM을 동의어처럼 사용하는 경향은 얼마 전 발행된 스탠포드 HAI의 연간 리포트에서도 볼 수 있었는데요. 그 와중에 흥미로운 단락이 하나 등장합니다. (185페이지). 바로 뉴로 심볼릭 AI (Neuro-symbolic AI, 이하 ‘뉴로 심볼릭’)라는 개념인데요. 안 그래도 복잡한데 이건 또 뭐냐? 하실 것 같아 AI 역사의 맥락 속에서 간단히 정리해 보겠습니다. AI 연구가 하나의 학문으로서 정립된 것은 1956년. 이 당시 주류 패러다임은 기호주의(symbolism)로서, 세계의 지식을 기호로 바꿔 컴퓨터에 계산하는 규칙 기반의 방법론이라 할 수 있음. 반면 현재 신경망 기술의 기원이 된 건 1957년 프랑크 로젠블랫(Frank Rosenblatt)이 발표한 퍼셉트론(Perceptron) 논문. 이 때부터 이 계열의 연구에는 연결주의(connectionism)라는 이름이 붙었음. 이후 AI 연구가 몇 차례 호황기와 부침을 겪는 오랜 기간 동안 주류의 위치를 차지해 온 건 기호주의. 그러나 떨어지는 효율성과 수익화 문제 등을 극복하지 못하며 1990년대 들어 산업 전체가 침체기에 빠짐. 2010년에 이르러 데이터셋과 반도체 성능의 비약적 발전과 함께 대세가 전환됨. 2012년, AI의 이미지 분류 정확도를 평가하는 이미지넷 (ImageNet)대회에서 제프리 힌튼 연구팀의 알고리즘인 ‘알렉스넷’이 획기적인 성과를 증명. 이때부터 신경망을 바탕으로 하는 딥러닝은 승승장구해 지금의 주류 패러다임이 되기에 이름. 뉴로 심볼릭은 이름처럼 신경망(neuro)과 기호주의(symbolic)를 혼합한 형태. 현재 AI 기술의 문제에 대한 대안으로 조금씩 언급되며 다양한 연구가 진행 중. (*AI 역사에 대해 더 읽고 싶으시다면 첫 책으로 케이드 매츠의 <AI 메이커스>를 추천드립니다.) 신경망, 기호주의에 대한 설명과 함께 미래 AI 생태계에 대한 흥미로운 예측을 들려주는 카톨린 욘커 교수 (영상: The Royal Institution 유튜브 채널) 방대한 데이터를 통해 자가 학습하는 딥 러닝 기술은 스케일과 성능의 측면에서는 월등하지만, ‘블랙박스’로 대표되는 설명 불가능성의 취약점을 가지고 있습니다. 이론상으로는 더 많은 데이터를 확보해 결과물의 정확도를 올릴 수 있지만 투입할 수 있는 데이터는 유한하며, 그에 따르는 환경 문제도 계속 지적되고 있죠. 반면 인간이 입력해 둔 지식을 바탕으로 세계를 재현하는 기호주의 계열 AI의 대표적 장점은 명시적인 법칙과 규칙을 알고리즘에 반영하기가 훨씬 용이하다는 것입니다. 가령 우리에게 익숙한 AI 윤리 문제(할루시네이션, 편향, 상식 부족 등)가 발생했을 때 그 원인을 정확히 특정해 낼 수 있습니다. AI에게 인간의 상식과 도덕관 등을 주입하는 연구에서 이 기술이 자주 언급되는 이유죠. (TED 강의로 화제가 된 최예진 교수의 연구가 좋은 예시입니다.) 뉴로 심볼릭은 오랫동안 경쟁해온 두 패러다임의 장점을 취해 성능과 설명 가능성, 두 마리 토끼를 모두 잡기 위한 시도라고 할 수 있습니다. ‘더 나은’ AI? 현재 AI 그 자체처럼 여겨지는 딥러닝 또한 기나긴 AI 흥망성쇠 역사의 일부라는 사실은 향후 5년, 10년 이후의 전망을 더욱 흥미롭게 만듭니다. 그리고 뉴로 심볼릭이라는 가능성은 앞으로 어떤 기술주에 투자해야 할지(?)에 대한 안목뿐만 아니라 AI 윤리의 쟁점들에 대해서도 시사하는 바가 있습니다. 가령 더 투명하고 설명 가능한 AI의 필요성에 대해 저희 레터에서도 여러 차례 다룬 바 있는데요. 스케일의 LLM과 투명한 심볼릭, 혹은 그 혼합체의 다양한 모델들이 서로를 보완, 공존하는 하이브리드 형태의 AI 생태계가 실현된다면 어떨까요? 저희 레터에서 다뤄 온 시급한 이슈들도 AI 기술 자체의 난제라기 보다는 LLM이라는 한 패러다임이 가졌던 한계점으로 기억될 날이 올지도 모릅니다. 그래서 블랙박스의 한계, 혹은 AI가 환경에 끼치는 영향이 기술 발전으로 인한 ‘불가피함’이라 누군가 말할 때, 뉴로 심볼릭은 (아직 대중화까지는 거리가 있음에도 불구) ‘더 나은 AI’에 대한 우리의 상상력을 확장해 준다는 점에서 의미를 가질 수 있지 않을까요? 강화학습이 강화하는 역사 by. 🥨채원 지난주, 무언가를 자세히 살펴 본다는 뜻의 영어 단어 ‘delve’가 화제가 되었습니다. 이 단어는 챗GPT를 자주 사용하는 사람들 사이에서 챗GPT에 자주 등장한다고 이미 널리 알려진 단어 중 하나였습니다. Y Combinator의 공동 창립자인 폴 그레이엄은 이를 X (구 트위터) 에 ‘누군가가 나에게 새로운 프로젝트를 제안하는 콜드메일을 보냈다. 그런데 거기에 단어 ‘delve’가 쓰였다는 사실을 알아챘다’며, 해당 단어가 챗GPT 등장 이후 사용 빈도가 크게 증가했다는 그래프를 첨부하였습니다. 해당 사건을 다룬 가디언지 기사에서는 ‘delve’라는 단어가 아프리카의 웹, 특히 나이지리아에서 자주 사용되는 단어라는 점을 지적합니다. 아프리카는 챗GPT를 비롯한 많은 언어 모델의 학습 데이터를 외주로 생산하고 있는 곳이기도 합니다. 지난 레터에서 케냐의 노동자들이 한시간에 2불이 채 되지 않는 임금을 받으며 챗GPT를 학습시킨 케냐 노동자들에 대한 TIME지의 심층 취재를 공유드리기도 했습니다. 그리고 챗GPT의 답변에 챗GPT의 학습 데이터를 생성하는 아프리카 화자들의 언어습관을 반영되었다는 것은, 기존의 언어모델의 문제로 제기되는 편향의 문제를 넘어선 사회경제적, 역사적 문제점을 시사합니다. RLHF 인간 피드백을 통한 강화학습(Reinforcement Learning with Human Feedback, RLHF)은 거대언어모델 (LLM)의 한계를 극복하기 위한 방법론 중 하나로 각광받고 있습니다. 챗GPT를 비롯한 LLM을 학습 시키는 방법론 중 하나인 RLHF는 인간의 피드백을 명시적으로 학습에 포함시킴으로서, 학습 데이터만을 기반으로 가장 확률이 높은 출력을 생성하는 것과 더불어 인간이 보기에 더 나은 출력을 생성하도록 돕습니다. 인간의 명시적인 선호도는 일명 선호데이터를 생성하여 학습에 추가하는 식으로 반영됩니다. 선호 데이터는 대개 서로 다른 LLM이 생성한 답변들과, 이들 중 채점자 (annotator)가 더 나은 답변으로 판단한 선호도로 구성되어 있습니다. 더 나은 답변이라는 것은 방식에 따라 정확도나 자연스러움 등 다양한 기준으로 정의됩니다. 수만건의 답변을 비교하여 판단하는 데에는 많은 사람이 필요하기 때문에 이 과정은 대개 크라우드소싱이나 외주를 통해 이루어집니다. 예를 들어 오픈AI의 WebGPT모델에 사용된 선호 데이터셋은 19,578개의 비교 데이터로 구성되어있습니다. 논문에 따르면 해당 데이터는 프리랜서로 고용된 56명이 생성했는데, 특히 이 중 다섯명이 데이터셋의 절반을 제공했다고 합니다. 즉, 이들 다섯명이 대략 데이터셋 전체의 10%씩을 각각 생성했다는 것입니다. 그렇다면 이 다섯명의 판단이 해당 데이터셋의 추이를 결정하는 데에 결정적인 역할을 했을 것으로 짐작할 수 있습니다. 논문은 이들의 인구구성학적인 정보를 밝히지 않고 있지만, 이 다섯명의 채점자 편향 (annotator bias)이 데이터셋에 반영될 소지가 있을 것입니다. 편향의 문제를 넘어서 폴 그래햄의 트윗으로 다시 돌아가서 살펴보면, 챗GPT로 생성한 메일은 인간이 작성한 메일보다 가치가 없다는 뉘앙스가 느껴집니다. 그리고 작성자를 판단하는 근거는 해당 메일에 포함된 ‘delve’라는 단어입니다. 하지만 만약 해당 메일이 챗GPT가 아닌 아프리카의 영어 화자에 의해 쓰인 메일이라면 어떨까요? 해당 화자는 영어를 외국어로 사용하는 본인의 언어 습관이 AI를 학습하는 데에 반영되었다는 이유로 부당한 차별을 받게 됩니다. 이와 관련하여 비영어권 화자의 영작문이 생성 AI 툴에 의해 표절로 판별될 가능성이 더 높다는 글을 전해드린 적이 있습니다. 함께 AI 윤리 레터를 발간하는 🤖아침이 비판한 것처럼, 이러한 데이터 편향은 AI 개발 비용을 줄이기 위해 남반구의 저임금 노동자를 착취하는 문제와 더불어, 이를 근거로 남반구의 영어 화자들의 언어를 'AI 텍스트'로 저평가하는 이중착취의 문제입니다. 나아가 나이지리아를 비롯한 다양한 남반구의 국가들에 영어 화자가 많은 것이 제국주의 국가들에게 식민지화되었던 역사 때문이라는 사실도 간과해서는 안 될 것입니다. 이미 다양한 형태로 착취되고 있는 사람들이 또다시 AI를 개발하는 데 저임금 노동으로 동원되고, AI가 가져올 혜택에서는 소외되면서, 이를 근거로 이루어질 수 있는 언어문화적 차별에도 노출되어 있습니다. 이는 제국주의와 신자유주의로 이어지는 차별의 역사가 AI라는 새로운 매개를 통해 구태의연하게 반복되고 또 강화될 수도 있다는 것을 보여줍니다. 🦜 같이 보면 좋은 글 🗺️ 생성형 AI 지도 교수님, 정말 제가 직접 썼습니다..! 💬 댓글 (💂죠셉) 영어로 쓰는 게 업인 제 직장에서도 언제부턴가 ‘delve into’가 하나의 밈이 된지라 더 흥미로웠습니다. 한국어 결과물에 비슷한 경향성이 존재할지도 궁금해지고요! (🧙‍♂️텍스) 요새 인공지능 분야 논문을 읽다보면 예전과 다르게 ‘showcase’ 동사가 자주 쓰이는데 챗GPT가 자주 사용하는 단어인가란 생각이 스쳐 지나가네요!

2024.04.30

·

·

136

AI의 일자리 위협에 대응할 비장의 한 수

생성형AI의 발전이 빠르게 이루어지면서, 일자리 위협이 현실로 다가오고 있습니다. AI전문가 조코딩은 인터뷰에서 ‘AI가 인간의 분야를 하나 하나 점령해 나갈 것’이라고 밝혔고, 국제통화기금(IMF)는 2024년 1월 14일 ‘인공지능과 일의 미래’보고서에서 AI가 전세계적으로 사람의 일자리의 40%에 영향을 미칠 것으로 내다봤습니다. 이외에도 수많은 전문가와 기관은, 구체적 수치에는 차이가 있지만 AI가 인간의 일자리를 뺏을 것이라는 데에 동의하죠. 사람들의 기술 실업이 대규모고 일어날 것을 막기 위해 장기적으로 기본소득의 도입을 고려할 수 있겠죠. 하지만 기본소득은 정책 특성상 추가적인 연구와 사회적 합의가 필요한, 반대하는 사람이 많은 쟁점적인 제도로 도입이 쉽지 않습니다. 따라서, 저는 AI로 인한 일자리 문제에 대응할 현실적인 방법으로 ‘주 4일제’, 혹은 더 나아가면 빌 게이츠의 발언처럼 ‘주3일제’등 법정 노동 시간의 단축을 제안합니다. AI는 ‘일자리’를 빼앗는 게 아닌, ‘일’을 더 해주는 도구다. AI와 일자리에 대해 이야기할 때, 우리는 자연스럽게 ‘AI가 일을 많이 해준다 → 인간의 일자리를 뺏는다’고 생각합니다. 그리고 이렇게 생각이 드는 이유는, AI가 기업이 해야 할 일을 줄여주면 남은 일이 줄어들어 인간이 해야 할 일이 줄어들고, 인간이 해야 할 일이 줄어들면 기업에 필요한 인간이 줄어든다고 생각하기 때문입니다. 이는 원래의 근로 환경에서는 맞는 말입니다. AI로 인해 해야 할 일이 줄어들었는데, 사람을 전부 그대로 고용하는 기업은 비합리적이죠. 하지만 기업 입장에서도 사람을 해고하는 것은 그렇게 기분 좋은 일은 아닙니다. 무엇보다, 기술 발전으로 인해 사회 전방위에서 해고가 이뤄진다면 노동자들의 저항은 커질 수 밖에 없습니다. 이때 기업 입장에서 근로자들의 고용을 유지할 수 있는 방법이 있습니다. 바로 근로자들의 총 근로 시간을 낮추는 겁니다. 간단한 식으로 예를 들어 보겠습니다. 기업이 목표로 하는 일의 양이 400이라고 가정했을 때, 기존의 경우 아래와 같습니다. 사람 10명 X 주5일 X 8만큼의 일 = 400 와 같은 형태로 기업이 운영됩니다. 여기에서 기입이 목표로 하는 일의 양이 400이고 AI가 80만큼의 일을 대신한다고 가정한 뒤 주5일제에 하는 일의 양이 그대로일 때는 아래와 같습니다. (사람 8명 X 주5일 X 8만큼의 일 = 320) + (AI가 하는 일 80) = 400 즉, 2명 만큼의 실업이 발생합니다. 위 상황에서 실업이 발생하지 않는 방법은 두 가지입니다. 1) AI가 할 수 없는 일이 증가하여, 사람이 할 일이 늘어나면 됩니다. 위에서는 AI가 할 수 없는 일이 80 증가하면 되겠죠. 하지만 AI가 할 수 있는 일이 늘어나는 흐름을 볼 때 일반적으로 발생하기 어려운 상황입니다. 2) 사람이 일하는 날짜나 시간을 줄입니다. 똑같이 식으로 나타내보면 아래와 같습니다. (사람 10명 X 주4일 X 8만큼의 일 = 320) + (AI가 하는 일 80) = 400또는(사람 10명 X 주5일 X 6.4만큼의 일 = 320) + (AI가 하는 일 80) = 400 이렇게 하면, 사람을 해고하지 않아도 됩니다. AI가 하는 일이 늘어난다면, 이에 맞추어 노동 일수를 주3일제로 줄이거나, 날마다 법정노동시간을 줄이면 어느 정도 균형을 맞출 수 있습니다. 다만, 기업 입장에서도 주4일제를 자발적으로 실행하는 것보다 AI를 써서 더 적은 돈을 쓰고 사람을 해고하는 게 더 이익인 경우가 많습니다. 따라서, 주4일제 등의 노동 시간 단축을 정부가 법으로 강제하지 않으면 제대로 실행되기 어렵습니다. 또한, 근로 시간을 단축시키는건 어디까지나 기술실업을 ‘지연’시키는 것이지, 고용을 늘리는 방법은 아닙니다. 기술 발전에 맞추어 진행해야 할, 고용 증가를 위한 정책은 따로 진행되어야 합니다. 마지막으로, 위에 작성한 내용의 경우, AI의 도입 비용에 대한 언급이 전혀 없습니다. 즉, 기업이 AI를 도입함에 따라 드는 비용을 충당하려면 사람의 월급에서 깎거나 근로 시간을 단축하더라도, 인력 감축도 병행해야 하는 상황이 발생할 수 있습니다. 그럼에도 근로 시간 단축을 하지 않는 것보다는 단축하는 것이 기업 입장에서 고용을 유지할 가능성이 더 높다는 사실은 바뀌지 않습니다. 기술 발전과 주4일제에 대한 논의 그렇다면 주4일제를 비롯하여 노동 시간 단축은 만능일까요? 아쉽게도 그렇지는 않습니다. 관련하여, 기존에 기술 발전과 노동 시간에 대해 다룬 연구들을 살펴봤습니다. 과학기술정책연구원(STEPI)의 보고서에 소개된 이규철의 연구에 따르면, 1993년 독일은 생산성은 높이고 그에 따른 비용은 줄이는 산업합리화가 일어났다고 합니다. 기술 발전에 따라 자연스럽게 나타난 이 현상으로 독일의 자동차 회사 폭스바겐은 노동자 감축을 추진했지만 노조의 반대에 부딪쳐 노동자들과 협상을 하게 됐고, 이 과정에서 주4일제를 시행하여 고용은 유지되었지만, 동시에 어느 정도 소득 감소를 추진했다고 합니다. 프랑스의 사례를 살펴볼까요. 임지영 교수의 연구에 따르면, 코로나 팬데믹 이후 프랑스에서도 주4일제 도입을 고려하고 있다고 합니다. 프랑스는 1998년과 2000년 두 차례에 걸쳐 노동시간을 주35시간으로 축소하였고, 이는 임금노동자의 고용 안정을 보장했다고 합니다. 하지만 기업들은 이에 맞춰 불완전 고용조건을 확대 적용하였고, 정부는 이를 해결하지 못하고 눈감아주며 결과적으로 불완전고용률 증가와 실업률 증가가 일어났다고 합니다. 이런 실패의 경험에도 불구하고, 미래의 노동 사회의 대안으로 프랑스에서는 주4일제 도입을 재논의하고 있는 것이죠. 이외에도, 주4일제에 대해 집중적으로 다룬 김은별 연구자와 이승윤 교수의 논문에서는 **주4일제의 도입 배경 중 하나로 ‘실업 및 저성장 문제 해결’**을 꼽았습니다. 대량 실업을 구조적으로 막음과 동시에, 노동자들이 새로운 기술을 교육받을 수 있는 시간을 제공해 준다는 점에서 주4일제 도입의 필요성을 주장하는 학자들이 있다고 합니다. 같은 연구에서는 다양한 사례를 연구한 결과, 주4일제가 기업의 생산성을 낮출 가능성은 적으면서도 노동자의 일과 삶의 균형을 보장한다고 밝히며 주4일제 도입에 대한 긍정적 효과를 주장하기도 했습니다. 앞서 살펴본 주4일제 연구들에서 공통적으로 알 수 있는 부분은, 충분한 논의 없이 주4일제를 도입하면 불완전고용 증가, 임금 감소 등의 부작용이 나타날 수 있다는 겁니다. 하지만 주4.5일제를 도입하는 방안이나, 노동자들이 필요로 하면 주4일제를 도입할 수 있게 하여 기업에 따라 선택적으로 유연하게 근로시간을 조정하게 할 수 있는 방안 등. AI로 인해 발생할 실업에 대비할 수 있는 근로시간 단축 정책은 다양하게 고려할 수 있다는 것도 확인했습니다. 따라서, 주4일제 도입의 한계와 단점을 지적하기보다 어떤 방식의 근로시간 단축 정책을 실행하여 AI발전으로 인해 가속화될 실업 증가를 막을지 논의가 필요한 시점입니다. 저는 기술 발전이 인류에게 많은 편의를 가져다준다고 믿고 있습니다. 컴퓨터와 스마트폰의 발전을 함께 겪으며 자란 세대로서 덕분에 공부도 더 편하게 하고, 지도도 더 편하게 보고, 게임도 더 재밌게 하고, 최근 AI로 정말 많은 업무시간 단축까지 이뤘거든요. 이왕 기술이 많이 발전해서 우리가 일을 많이 할 필요가 없다면, 다같이 일은 덜 하고, 더 많이 쉬면서 돈도 벌 수 있으면 좋지 않을까 생각합니다. 주4일제와 같은 사회제도에 대한 논의가 더 많이, 더 빠르게 이루어져 사람이 AI 발전의 장점은 누리고 단점은 최소화할 수 있게 되길 바랍니다.

2024.04.24

·

·

AI 윤리 레터

156

AI를 지켜보는 거친 생각과 불안한 눈빛

AI 윤리 뉴스 브리프 2024년 4월 넷째 주 by. 🎶소소 1. AI Index Report로 보는 AI 윤리 스탠퍼드 인간중심AI연구소가 발간하는 AI Index Report는 전세계 AI 주요 현황을 가늠할 수 있는 다양한 지표를 제공합니다. 최근 이 보고서를 인용한 한국 기술 수준이 이집트, UAE에 밀렸다는 보도가 논란이 되기도 했는데요. 우리나라 과기정통부는 보고서의 분석 대상에서 한국이 제외되었다는 항변과 함께 우리의 기술 수준이 얼마나 뛰어난 지에 대한 정책브리핑을 냈습니다. AI 연구가 영미권을 중심으로 이루어지다 보니 이런 소동도 벌어지는데요. 대학 순위 같은 지표에 우리가 너무 집착하고 있는 게 아닌가 하는 생각이 들었습니다. 보고서에서 참고할 만한 AI의 사회적 영향과 관련된 지표 몇 가지를 소개합니다. AI 사고 건수는 2013년 대비 20배 이상 증가했습니다. AI 활용이 확대되고, 위험에 대한 인식도 같이 높아지며 신고 건수가 늘어났기 때문이라고 추측됩니다. AI 제품과 서비스에 대해 불안함을 느끼는 사람(52%)뿐만 아니라 AI가 내 삶에 미치는 영향이 클 것이라 생각하는 사람(66%)은 모두 작년 대비 증가했습니다. AI 규제도 전세계적으로 계속해서 늘어나고 있습니다. 점점 더 많은 규제기관이 AI 시스템의 영향을 평가하고 위험을 완화하는 데 관심을 보이고 있는데요. 이에 반해 아직 AI 모델의 위험 평가 지표는 표준화되지 않고 있습니다. AI 모델의 위험이 정확히 평가되지 않으면 규제도 어려울 수 있습니다. 보고서는 AI 모델의 개인정보보호, 투명성, 안전성, 공정성을 평가할 수 있는 최근 연구와 벤치마크도 함께 소개하고 있습니다. 2. 오픈소스로 공개된 라마3 메타가 새로운 오픈소스 모델 라마3(Llama3)를 공개했습니다. 모델의 성능이 크게 향상되어 GPT-4 못지않다며 AI 커뮤니티의 지지를 받고 있는데요. 더 많은 사람이 사전 학습의 부담 없이 초거대AI를 활용할 수 있기 때문입니다. 실제로 라마 모델을 기반으로 많은 서비스가 생겨나고 관련 연구도 활발해졌습니다. 오픈소스 모델은 누구나 어떤 목적으로든 활용할 수 있는 만큼 위험하게도 활용할 수 있다는 점이 고려되어야 합니다. 메타는 AI 모델의 안전성을 높이기 위해 종합적인 안전 조치를 진행했다고 밝혔습니다. 이용자의 질문(프롬프트)과 모델의 답변의 안전성을 감지하고 분류할 수 있도록하고 내외부 전문가 레드팀으로 모델의 안전성을 평가하고 개선했다고 하는데요. 앞으로 라마3를 기반으로 새로운 서비스를 만들게 될 개발진의 역할도 중요합니다. 메타는 책임있는 개발 가이드를 배포하며, 모델의 오픈소스화는 AI 생태계를 하나로 모으고 잠재적 위험을 완화하는 방법임을 강조했습니다. 한 편 라마3가 진정한 오픈소스라고 볼 수 있는가에 대한 논쟁은 여전히 남아있습니다. 오픈소스의 정의에는 정보의 공개 여부뿐만 아니라 사용 권한의 범위도 포함되기 때문입니다. 라마3는 모델 카드에서 모델 아키텍처, 매개변수, 여러 벤치마크 평가 결과를 함께 공개했습니다. 그러나 라마3의 사용 제한 조건은 라마2와 동일합니다. 출시일 기준 MAU(월간활성사용자)가 7억 명 이상인 서비스 사업자는 모델을 사용할 수 없고, 라마3의 생성 결과물로 다른 모델의 학습에 활용할 수 없으며, 모델 훈련 데이터도 15T라는 것 외에 공개된 것은 없습니다. 3. 영국, AI로 성착취물 생성만 해도 처벌 영국 정부가 당사자의 동의 없이 AI로 성적인 이미지나 영상을 만든 사람을 처벌할 수 있는 형법 개정안을 마련했습니다. 제작자는 이미지나 영상의 공유/유포와 관계없이 처벌됩니다. 물론 성착취물을 외부에 공유하는 경우에는 지난해 개정된 온라인안전법에 의거하여 더 무거운 처벌을 받게 됩니다. 앞으로 AI로 만든 사진이나 영상의 품질은 더 높아지고, 진위를 구분하기는 점점 더 힘들어질 것입니다. 미국 FBI는 AI로 생성한 성착취물 피해자가 증가하고 있음을 경고했습니다. 한국에서도 딥페이크로 합성한 영상물로 인한 디지털 성범죄가 늘고 있다고 합니다. 피해자 절반 이상이 10~20대 여성이라는 점이 매우 우려되는 상황입니다. 생성 AI를 이용한 여성의 성적 대상화를 막고 안전을 보장하기 위한 예방책이 절실합니다. 더 읽어보기 생성 AI 성착취물 시장의 구조(2023-09-04) AI 분야의 젠더 격차(2024-02-21) 4. 데이터를 사모으는 어도비 어도비(Adobe)가 영상 생성 AI 모델을 만들기 위해 분당 3달러에 비디오 데이터를 구입한다고 합니다. 이미지나 영상 데이터의 출처를 언급하지 못하고 있는 오픈AI와 달리 어도비는 ‘저작권 문제 없는 데이터’를 강조해 온 행보를 이어갈 것으로 보입니다. 물론 학습 데이터를 구매하는 것만으로 모든 문제가 해결되는 것은 아니지만요. 더 읽어보기 데이터, 어떻게 팔아야 잘 판 걸까? ...팔아야 하는 걸까?(2024-03-25) 오픈AI를 곤란하게 하는 학습데이터(2024-03-18) 생성 AI와 저작권, 정산은 본질이 아니다(2023-07-10) 오늘 이야기 어떠셨나요?여러분의 유머와 용기, 따뜻함이 담긴 생각을 자유롭게 남겨주세요.남겨주신 의견은 추려내어 다음 AI 윤리 레터에서 함께 나눕니다.

2024.04.23

·

·

AI 윤리 레터

179

왜 인공지능은 정치적일까?

스케일이 커진다면 지능이 등장할까? [Part. 2] by 🧙‍♂️텍스 데이터로 모방한 지능 앨런 튜링은 1950년 “Computing Machinery and Intelligence”라는 논문에서 흔히 튜링 테스트라고 불리는 이미테이션 게임(Imitation game)을 제안했습니다. 튜링 테스트는 컴퓨터(A)와 사람(B) 그리고 심판(C)의 세 플레이어가 있는 게임으로 대화를 통해서 심판이 컴퓨터와 사람을 판별합니다. 심판은 상대방을 직접 확인할 수는 없고 터미널을 통해서 대화를 주고받습니다. 심판이 만약 사람과 컴퓨터를 구분하지 못한다면 컴퓨터가 지능을 갖고 있다고 생각할 수 있지 않냐는 제안입니다. 튜링 테스트는 인공지능 분야의 근간을 형성해 왔습니다. 데이터로 구축한 인공지능 알고리즘은 암묵적인 튜링 테스트를 수행합니다. 벤치마크 상 성능 측정은 심판의 역할을 대체합니다. 이 관점에서 생각하면 더 많은 데이터를 사용한다는 것은 사람의 행동을 더 잘 모방하려는 시도라는 것을 명확하게 알 수 있습니다. 심판이 어떤 질문을 할지 모르니 최대한 준비를 잘해두는 것이죠. 앞서 살펴본 GPT-1, GPT-2 그리고 GPT-3에서 보듯이 학습 데이터와 모델의 스케일을 키우면 성능이 오릅니다. GPT-4에 이르러서는 SAT나 변호사 시험 같은 시험에서 사람 수준의 성적을 달성했다고 주장합니다. 적어도 시험 채점하는 사람 입장에서는 알고리즘인지 사람인지를 구분하기 힘든 시대가 되었다고 할 수 있습니다. 이런 맥락에서 모델과 데이터 스케일이 더 커지면 AGI에 도달할 수 있지 않겠냐고 기대하는 것입니다. 다만, 출제자의 의도를 비틀어서 문제를 푼 느낌입니다. 심판이나 인간은 개별 사람인 데 반해서 컴퓨터는 인터넷 스케일의 데이터를 다루는 상황이기 때문이죠. 탐탁지는 않지만, 이러한 인공지능 알고리즘은 적어도 튜링 테스트 관점에서는 지능의 요소를 갖추고 있다고 조심스럽게 말해볼 수 있을 것 같습니다. 또한 이러한 지능은 벤치마크 내에서만 작동한다는 한계가 있습니다. 학습 데이터를 바꾸면 인공지능 알고리즘의 성질도 바뀌기 때문이죠. 스케일 법칙 또한 평가용 벤치마크 내에서 스케일을 키웠을 때 성능이 오른다는 이야기이기 때문입니다. 고려 대상 밖의 데이터에 대해서 성능이 오른다는 증명이나 법칙은 없습니다. 단지 믿음일 뿐입니다. 이러한 맥락에서 현시대의 인공지능은 데이터 지능이라고 불러야 할 듯싶습니다. 데이터 지능 길들이기 인터넷에서 수집한 데이터는 굉장히 많은 잡음이 섞여 있습니다. 사회의 다양한 의견 뿐만 아니라 극단적인 주장도 포함되어 있고, 시간에 따라서 사실이 변했거나, 불확실한 정보 또한 담겨있을 것입니다. 데이터를 모방하는 현재의 인공지능 패러다임의 특성상 데이터를 정제는 필수적입니다. 이 과정을 통해 사회적인 합의를 데이터의 형태로 표현하고 알고리즘을 이를 모방합니다. 하지만 많은 경우 정제한 결과를 사회적인 합의라고 가정하는 경우가 더 많은 것이 아닌가라는 의문이 듭니다. 최근 구글 제미나이의 이미지 생성 알고리즘의 해프닝은 이러한 문제가 얼마나 어려운 지에 대해서 알 수 있습니다. 제미나이 이미지 생성 알고리즘의 해프닝 관련 X 포스팅. 출처: X 포스팅 링크 데이터셋의 편향으로 인해 알고리즘이 성별이나 인종에 대한 편견을 갖는다는 사실은 생성AI가 등장하기 이전에도 이미 많이 알려져 있습니다. 이를 보완하기 위해서 성별과 인종같이 편향이 있는 개념에 대한 편향없는 예측을 강제하도록 하는 불편향(de-biasing) 알고리즘이 많이 제안되었습니다. 제미나이의 문제는 불편향 알고리즘과 생성AI의 교차 지점에서 발생한 것으로 보입니다. ‘흑인으로 묘사된 미국 건국의 아버지’, ‘흑인 나치 군인’, ‘여성 교황’은 사실 정보에 약한 현재 생성AI의 특성을 보여주는 사례입니다. 사회적 지능이 있다면 사실 정보와 윤리적 개념을 이해할 수 있겠지만, 데이터 구성에 판단을 위탁하는 현재 알고리즘에는 어려운 문제입니다. 현재 인공지능 알고리즘이 이를 다루기 위해서는 데이터셋 상 편향을 완화하면서도 동시에 실존 인물들에 대한 사실 정보를 모두 고려하여야 합니다. 이러한 사례뿐만 아니라, 데이터 지능은 AI 윤리에서 새롭게 밝혀지는 사실을 모두 케이스 바이 케이스로 다뤄야 할 가능성이 높습니다. 오픈AI는 스케일은 이러한 문제를 해결해 주지 않는다는 사실을 가장 잘 알고 있습니다. 오픈AI는 정렬(alignment) 이라는 방법을 고안하고 나서야 챗GPT 서비스를 시작했습니다. GPT-4에서도 여전히 AI 정렬을 사용하고 있습니다. 결과적으로 현재 데이터 지능의 패러다임에서 데이터셋을 구축은 그 자체로 지능을 부여하는 것과 동일합니다. AI 윤리 또한 자연스럽게 고려되어야 할 수 밖에 없습니다. 그리고 최근에는 챗GPT가 생성한 결과에 직접적인 피드백을 줄 수 있는 인터페이스가 추가되었습니다. 챗GPT에 대한 피드백을 제공해 주기 때문에 사회적 지능에 대한 내부 벤치마크를 구성하는 용도로 사용될 가능성이 높습니다. 스케일이 지능을 만드는 것은 아니지만, 벤치마크로 포획된 데이터는 잘 푼다는 데이터 지능의 특성을 고민해 볼 필요가 있습니다. 또한 이렇게 수집한 데이터는 외부로 공개되지 않는다는 측면에서 추후 추격하든 다른 회사 대비 오픈AI의 차별성이 될 가능성이 높습니다. 이는 장기적으로 사용자층을 많이 보유하고 있는 글로벌 LLM 서비스들이 관련 시장을 독과점할 가능성이 높지 않겠느냐는 우려를 낳습니다. AI 정렬 (Alignment)은 오픈AI가 InstructGPT라는 연구에서 제안한 거대언어모델(LLM) 미세조정기법입니다. 사용자 의도를 훨씬 더 잘 따를 수 있게 명령어 대화 데이터셋을 구성하고 이를 이용하여 거대언어모델을 미세 조정하는 기법이며, 이 과정을 통해 보다 진실되고(truthful) 덜 독성(toxic)을 가진 생성 결과 의도하였다고 주장합니다. 실천적 지능을 위한 AI 에이전트 튜링 테스트는 이미 한계를 맞이했기에 이를 보완할 수 있는 지능의 정의가 중요합니다. 최근 관심을 받는 AI 에이전트는 목적에 따라서 작업을 계획하고 실행에 옮기는 것을 목표로 합니다. AI 에이전트가 목표를 달성하기 위해서는 튜링 테스트 지능과는 다른 형태의 실천적 지능을 요구합니다. 최근 오픈AI의 sora가 놀라운 동영상 생성 능력으로 많은 관심을 받았습니다. 흥미로운 점은 sora의 기술 보고서의 제목 “Video generation models as world simulators”에서 드러나듯이 동영상 생성뿐만 아니라 sora는 현실 세계에 대한 시뮬레이터 역할도 가능한 것으로 보입니다. 과거 오픈AI가 수행했던 마인크래프트 에이전트 연구를 보면 동영상 기반의 시뮬레이터에 대한 힌트를 얻을 수 있습니다. 실제로 sora의 데모 영상 중에도 생성된 마인크래프트 플레이 영상이 있습니다. 2022년 6월에 공개된 Video Pre-training Model (VPT)는 마인크래프트 에이전트를 만드는 방법을 제안했습니다. 학습된 VPT는 동영상 기반의 마인크래프트 에이전트이자 시뮬레이터로 사용될 수 있습니다. 이 연구는 다이아몬드 곡괭이를 만들 수 있는 첫 번째 마인크래프트 에이전트로 유명세를 치렀습니다. VPT를 구축하는 전체 파이프라인은 챗GPT를 만드는 과정과 유사합니다. 우선 두 종류의 데이터 수집을 했습니다. (1) 인터넷에서 대규모 마인크래프트 플레이 영상을 수집하여 정제하였고 (2) 사용자의 키보드 조작이 포함된 고퀄리티의 마인크래프트 플레이 영상 데이터셋을 직접 구축하였습니다. 이 두 가지 데이터셋을 이용해 VPT를 사전 학습을 합니다. 학습된 VPT는 동영상 속 사용자가 어떤 키보드 조작으로 캐릭터를 조종했는지 역으로도 알 수 있으며, 어떤 동작을 할 때 게임 속 미래 예측이 가능합니다. (3) 하지만 에이전트로써는 능력이 부족했기 때문에 VPT를 풀고자 하는 문제에 미세 조정(fine-tune)을 합니다. 여기서는 다이아몬드 곡괭이를 만들기 위한 미세 조정을 합니다. 앞으로 AI 에이전트 등장도 VPT와 비슷한 양상을 보일 것으로 예상됩니다. (1) 사전 학습을 위한 대규모 데이터셋이 필수적일 것입니다. (2) 에이전트가 환경과 상호작용하는 데이터셋이 필요할 것입니다. (3) 그 자체로는 작업을 수행할 능력이 부족할 것이기 때문에 작업에 대한 정교한 미세 조정이 필요합니다. 인공지능에 대한 하이프(Hype)를 경계하자 이 글에서는 현재 생성AI로 대표되는 인공지능을 데이터 지능이라는 표현으로 지칭했습니다. 데이터 형태로 사회적 합의를 서술하는 것은 매우 섬세한 작업이며 높은 노력을 요구로 합니다. 이는 단순히 데이터의 양을 늘려서 해결되는 부분이 아니라 질을 올려서 해결해야 하는 부분을 의도했습니다. 인공지능에 대한 과도한 기대 혹은 하이프를 경계하자면서도 데이터 지능이라고 짚은 이유는 스케일 업은 파운데이션 모델이라는 개념어로 이미 인공지능 알고리즘의 패러다임으로 굳어졌기 때문입니다. 엔비디아뿐만 아니라 인텔, AMD 등 내로라하는 반도체 기업들이 파운데이션 모델 혹은 생성AI용 반도체를 이야기하고 있습니다. 특정 알고리즘을 위한 전용 하드웨어는 실행 속도 및 전력 측면에서 로그 단위의 획기적인 개선을 가져오는 경우가 많습니다. 이렇다는 것은 스케일 업에 대한 비용이 크게 줄어들면서, 현재 생성AI가 다른 분야로 빠르게 전파되고 관련 논의가 반복될 가능성이 크다는 것을 의미합니다. 유튜브의 동영상을 인공지능 학습에 사용하지 말라는 구글의 경고(2024년 4월 둘째 주 브리프)는 이미 동영상에 대한 대규모 데이터셋 수집이 AI 에이전트를 위해 이루어지고 있다는 현실을 보여줍니다. 이미지나 텍스트에서도 콘텐츠 창작자가 논의에서 소외되어 있었는데 동영상에서도 마찬가지로 언급되지 않고 소외되고 있습니다. 학습용 데이터의 기저에는 사람의 프라이버시나 저작권과의 교차점이 언제나 존재합니다. 이러한 논의를 꾸준히 진행해야 빠르게 변하는 시기에 관련 논의에서 주도권을 잡을 수 있으리라 봅니다. 다만, 최근 AI 에이전트 분야에서 일어나는 하이프에 대해서는 크게 경계해야 할 필요가 있습니다. AI 에이전트는 튜링 테스트를 벗어나는 지능을 달성할 가능성을 갖고 있지만, AI 에이전트를 잘 작동시키기 위해서는 넘어야 할 산이 많습니다. 텍스트나 이미지, 비디오와 같은 (1)의 형태의 데이터는 인터넷에 많이 있지만, AI 에이전트가 환경과 상호작용하는 (2)의 형태의 데이터는 매우 희귀합니다. 특히, 올해 휴머노이드 로봇에 대한 이야기들은 강한 하이프로 생각됩니다. 현실에서 작동하는 로봇에 대한 데이터는 매우 드물고 이에 대한 (1), (2), (3)의 형태의 데이터셋 구축은 매우 어려운 일입니다. 즉 생성AI와 다르게 스케일 업에 기반한 데이터 지능을 구축하기 비용이 크게 듭니다. AI 에이전트는 기존 생성AI 대비 인간에게 직접적인 위해를 끼칠 가능성이 더 크기 때문에 AI 윤리 관점에서의 성찰이 필요할 것으로 보입니다. Stable Diffusion과 챗GPT는 창작 툴과 같은 형태로 제공되기 때문에 현실에 직접적으로 위해를 끼치지는 않습니다. 하지만 AI 에이전트의 경우는 현실에서 작업을 수행할 수 있는 형태이기 때문에 인간에게 직접적인 위해를 끼칠 가능성이 더 커집니다. AI 에이전트에게는 기존 인공지능 알고리즘보다 더 높은 AI 윤리 기준을 고민해볼 필요가 있다고 보입니다. 그래서 왜 AI가 정치적이라고요? by. 🤔 어쪈 ‘인공지능은 정치적이다.’ AI 윤리 레터를 계속 읽어온 구독자라면 꽤나 익숙하게 느껴질 문장일테죠. 하지만 인공지능이 왜 정치적인지 명쾌하게 답하기란 여간 쉬운 일이 아닙니다. 이제 막 선거가 끝나서인지 정치캠페인 속 딥페이크나 이른바 ‘가짜뉴스’를 퍼나르는 추천 알고리즘과 같은 사례가 먼저 떠오르는데요. 보다 넓은 의미의 정치를 생각해볼 순 없을까요? AI 윤리 북클럽에서 <민주주의와 AI>를 주제로 읽은 두번째 책, <인공지능은 왜 정치적일 수밖에 없는가 (마크 코켈버그 저)>는 앞서 던진 질문을 고민하기에 제격인 저작입니다. 다만 지금껏 읽은 것 중에 평이 가장 극명하게 갈린 책이기도 합니다. 아마도 AI의 주된 정치적 쟁점을 면밀히 분석하기보다 기존 정치철학적 논의가 AI와 어떻게 연결되는지를 살피고, 그 과정에서 파생되는 질문들을 계속해서 던질 뿐 좀처럼 명쾌한 저자만의 답을 들려주지 않아서였던 것 같아요. 분명 다소 도발적인 번역본 제목보다 원제(AI의 정치철학; The Political Philosophy of AI)가 더 어울리는 개론서입니다. 정치철학을 AI로 업데이트하기 책의 각 장은 정치철학의 주요 개념으로부터 출발합니다. 책의 전반부에서 다루는 자유, 평등과 정의는 AI가 사회에 보다 깊숙이 자리잡으면서 그 의미와 전제를 재검토해야하는 대상이 되었습니다. AI 덕분에 대규모 인간 행동 데이터를 분석하고 개입할 수 있게 된 지금, ‘넛지’라는 단어 아래 손쉽게 조종당하는 우리는 여전히 자유롭다고 할 수 있을까요? 과거에 축적한 데이터 간 상관관계만을 학습한 AI를 보다 평등하고 정의로운 미래 사회를 구축하는 데에 쓸 수 있을까요? 자유, 평등과 정의에 대한 논의가 AI를 고려하여 갱신되어야 한다면, 이를 토대로 하는 민주주의 역시 마찬가지일겁니다. 특히 우리가 민주주의를 실현하기 위해 발전시켜 온 제도가 자유를 기본 전제로, 평등과 정의를 주요 방향성으로 삼아 설계되었기 때문에 이것이 여전히 유효한지 의문을 제기할 수 있겠죠. 책은 앞서 언급된 물음들을 권력이라는 개념을 중심으로 다시 살펴보기도 합니다. AI는 권력을 행사하기 위한 도구로 직접 쓰일 수도 있지만, 새로운 권력 작동 방식과 적용 지점을 만들어 낼 잠재력 역시 갖고 있습니다. 또한 AI가 지금의 지배적인 이데올로기 아래에서 만들어진만큼 다양한 사회적 모순에서 결코 자유롭지 않으며, 오히려 강화하기도 하죠. 더 나아가 권력이 꼭 하향식으로만 작동하는 게 아니라 미시적 수준에서 개개인의 자아정체성을 구성하는 것 역시 권력작용이라는 지적은 AI에 가상의 ‘빅 브라더’ 이미지를 씌우기보다 실제 우리 지각과 행동을 매개하는 AI 기술에 주목할 것을 제안합니다. “AI는 하나부터 열까지 정치적”이라는 저자의 입장을 다르게 표현하면 AI는 가치중립적이지 않다는 말이기도 합니다. 하지만 거꾸로 화살을 우리에게 돌려볼 수도 있습니다. AI에 더 많은 행위주체성을 부여할수록 동물, 환경을 포함한 비인간에 대한 인간의 정치적 입장의 재고 필요성 역시 커지는 셈이죠. 요컨대 인간중심적 사고방식에서 벗어나 지금껏 논의한 주제들을 다시 살펴봐야할 수도 있다는 뜻입니다. AI 윤리에서 기술 윤리로, 또다시 AI 윤리로 책의 주제는 분명 AI이지만, AI가 아닌 다른 기술을 중심으로 서술하더라도 크게 다르지 않은 내용이 담겼을 것으로 보입니다. 예컨대 <가짜뉴스의 고고학>에서 살펴봤던 것처럼, AI 등장 이전에도 시대별로 여러 미디어 기술들이 정보를 조작하고 사람들을 조종하기 위해 쓰였죠. AI가 (정치철학적) ‘문제‘라는 주장은 충분히 설득력이 있었지만 왜 ’AI‘가 문제인지에 대해서는 책을 읽는 내내 물음표가 떠올랐습니다. 하지만 덕분에 우리가 왜 AI 윤리 북클럽이라는 이름 아래 모여앉아 책을 읽고 토론을 하는지를 다시금 확인할 수 있었습니다. 오직 ‘AI’에만 관심이 있었다면 이런 책을 읽지도, AI의 정치철학을 논하지도 않았겠죠. 분명 그보다는 공동체와 사회에 대한 관심이 우리를 AI 윤리라는 주제로 이끌었을 겁니다. 물론 우리는 AI에도 관심이 많습니다. 이 책을 통해 ‘그 어떤 것도 정치적이지 않을 수 없다’는 명제를 되새기며 AI 윤리에서 기술 윤리로 시야를 넓힐 수 있었다면, 다른 책을 통해 ‘왜 AI인가‘라는 질문에 대한 답도 찾아보려 합니다. 💡 그 외 모임에서 나온 질문들: 인공지능이 사용자 데이터를 기반으로 맞춤형 콘텐츠를 제공할 때, 이것이 사용자의 의사결정에 실제로 얼마나 영향을 미치는 것일까? 이러한 영향을 토대로 AI를 억압 및 착취의 도구가 아닌 변화의 도구로 만들기 위해서는 어떻게 해야 하는가? 거대언어모델(LLM)을 빅테크 기업만이 아니라 누구나 사용할 수 있게 된다고 더 민주적인 사회가 될까? 기업 소유의 소셜 미디어와 정부 통제 미디어 중 무엇이 더 민주적인가? 민주적이지만 더 민주적이지 않은 역설이 발생하진 않는가? 데이터는 누구의 것인가? 정말 이용자만의 것이라고 할 수 있는 것일까? 이용자의 것으로 규정하고 관련 제도가 마련되면 권력의 비대칭이 사라질 것인가? 그 외로는 이용자(또는 소비자)로서의 대항 권력을 갖출 방법이 없는가? 인간 → 동물 → 환경 → 인공지능까지 정치적 지위의 인정 범위를 계속해서 확대해야만 하는 것인가? 인간중심적이지 않은 비인간중심성은 가능한 것일까? 오늘 이야기 어떠셨나요?여러분의 유머와 용기, 따뜻함이 담긴 생각을 자유롭게 남겨주세요.남겨주신 의견은 추려내어 다음 AI 윤리 레터에서 함께 나눕니다.

2024.04.20

·

·

208

인간의 일자리를 빼앗을 AI, 나쁜 녀석일까?

[인터뷰] 개발자 겸 유튜버 조코딩의 진단 "1차 산업혁명처럼 문제도 있겠지만 결국..." -인터뷰어 및 정리 : 김재경 *세상을 바꾸는 인터뷰' 시리즈는 기존 인터뷰들과 색다른 접근(인물, 이슈 등)을 통해 공익적 목적을 달성하고자 기획되었습니다. 김민준(오마이뉴스 시민 기자)과 김재경(연구활동가(Activist Researcher))가 함께 약 2주에 한 번 오마이뉴스, 캠페인즈, 얼룩소, 브런치에 연재합니다. 2022년 11월, 챗지피티(ChatGPT)가 출시되고 인공지능(AI)이라는 키워드는 알파고와 이세돌의 대국 이후 두 번째 전성기를 맞이하게 됐습니다. AI는 글쓰기부터 코딩, 번역 이미지 및 동영상 생성 등 다양한 분야에서 인간의 보조 혹은 그 이상을 수행해내며 우리의 삶을 바꿔나가고 있습니다. 하지만 관련 뉴스에선 주로 어떤 AI 기술이 얼마나 발전했는지, 혹은 엔비디아(NVDIA) 같은 반도체 기업의 동향에 대해 주목할 뿐 정작 보통 시민들이 궁금해할, AI가 우리의 삶을 어떻게 바꿀지에 대한 정보는 부족한 편입니다. '세상을 바꾸는 인터뷰 AI 시리즈’는 이런 내용들을 심층적으로 다루고자 합니다. 이번에는 AI를 직접 서비스하는 개발자이자, 재밌고 유익한 AI 컨텐츠들로 대중과 소통하고 있는 유튜버 조동근(이하 조코딩)님을 만나봤습니다. 3월 27일 구로디지털단지에서 진행된 조코딩님과 인터뷰는 흥미롭고 유익했는데요. 본인이 AI 전문성을 가지고 있으면서 시인, 음악가 등의 전문가와 AI에 대해 의견을 나누고, AI 컨텐츠와 정보를 유튜브로 내보내며 대중과 소통하는 조코딩님은 AI가 우리 삶의 다양한 영역에 어떤 영향을 미칠지 여쭤보기에 가장 적합한 분 중 한 명입니다.. 인간의 분야를 하나씩 정복해 나갈 AI - 간단한 자기 소개 부탁드립니다. "안녕하세요. 저는 유튜브에서 누구나 배울 수 있는 쉬운 코딩 채널 유튜브 조코딩 채널을 운영하는 유튜브 크리에이터 조코딩(실명 조동근)입니다." - 최근 AI와 관련하여 다양한 흥미로운 컨텐츠를 진행하셨죠. 그루비룸이라는 프로듀서와 같이 노래를 만들어보기도 하고, 가수 폴킴과 함께 AI와 가수 중에 진짜 가수를 찾는 'AI클론싱어'도 진행했어요. 이런 프로그램들을 기획하게 된 계기는 무엇인가요? "저는 생성형 AI가 인기를 끌기 전부터 개발과 관련된 컨텐츠를 만들어왔는데요. 마침 유튜브가 주최한, 아티스트와 협업할 수 있는 아티스트 커넥트 프로그램에 참여하여 10CM의 권정열님과 함께 컨텐츠를 진행할 수 있는 기회를 얻었습니다. 어떤 걸 같이 할 지 고민하다 나온 아이디어 중 하나가 말씀해 주신 '클론싱어'였죠. 이외에도 'AI 공작소'를 통해 지금까지 사용중인 저희 유튜브 채널 엔딩곡을 권정열님과 함께 AI로 만드는 등 다양한 생성형 AI 컨텐츠를 만들어 왔습니다."- 앞선 질문에서는 '음악'과 관련된 AI를 전문가분들과 함께 다루셨고, 직접 서비스하시는 '조카소 AI'에서는 조만간 사진을 올리면 댄스 영상을 만드는 '댄스 AI'도 출시 예정이죠. 이런 경험들을 토대로 봤을 때, 현재 생성형 AI의 성능은 분야별로 어느 정도인가요?"현재 분야마다 AI의 발전 정도가 다르지만, 앞으로 한 분야씩 인간 전문가보다 더 뛰어난 능력을 보이게 될 겁니다. 이미지 인식의 경우, AI가 인간의 성능을 뛰어넘었고, 이미지 생성 AI의 경우엔 점점 인간의 창작물과 구분하기 어려워지고 있어요. 개발자 입장에서도 다양한 AI를 활용하면 여러 분야의 전문가와 함께 일하는 효과가 있습니다. 실제로 제가 만든 AI 서비스인 '조카소'에서 활용하는 AI도 무료 오픈 소스로 제공된 AI를 활용해 기존보다 쉽게 제작했습니다."- 앞서 살펴본 생성형 AI의 발전에 대해, 각 분야의 전문가분들은 어떻게 생각하시는지 간단히 들어볼 수 있을까요?"생성형 AI의 성능이 좋아진 만큼, 관련 업계 종사자들의 우려 역시 커지고 있습니다. 개발자를 준비하던 분들의 경우, 이미 AI가 개발자를 대체하기 시작했기 때문에 진로를 고민하게 됐습니다.그리고 앞서 소개했듯이 이미지 생성AI의 성능은 매우 뛰어난데요. 제 채널에서 하상욱 시인과 ChatGPT가 대결했던 적이 있는데, 많은 분들이 어떤 시가 하상욱 시인이 작성한 건지 헷갈려 하셨을 정도로 생성형 AI가 시 역시 잘 작성하고 있습니다. ChatGPT-4의 시대에 이미 여러 분야에서 AI의 성능이 뛰어난데, 곧 나올 ChatGPT-5 혹은 그 이후 버전이 나온다면 생성형 AI가 더 많은 분야의 많은 전문가들에게 유용함과 걱정을 함께 안길 것 같습니다."- 과거에 전문가들이 내놓은 예측 중, 예술가는 AI로부터 안전할 거라고 하는 등 AI가 위협할 일자리들에 대한 예측이 많이 틀렸음을 쉽게 알 수 있죠. 겨우 5년, 10년 전인데 AI와 관련된 예측들이 왜 크게 빗나갔을까요?"당연한 이야기지만, 미래는 아무도 알 수 없기 때문입니다. 미래학자이자 공학자인 레이 커즈와일이 말한 '수확 가속의 법칙'에 따르면, 기술의 발전 속도는 점점 빨라지고 있으며, 이에 따라 과학 기술이 할 수 있는 일을 전문가조차도 예측하기 어렵게 된 거죠. 그럼에도 OpenAI의 CEO인 샘 알트만이나 NVDIA의 CEO인 젠슨 황과 같이 AI 업계 최선두를 달리는 전문가들의 예측은 다른 전문가들의 예측보단 맞을 확률이 높다고 생각합니다." - 그렇다면, 생성형AI가 사람들의 일자리를 위협할까요? 위협한다면, 얼마나 위협할까요?"당연히 위협할 수밖에 없는 상황입니다. AI의 발전은 산업혁명처럼 혁신적이고 사회에 큰 영향을 미쳐서 'AI혁명'이라고 불릴 정도죠. 최근 증권사리포트를 보면 프리랜서 작가 수입이 이미 낮아졌어요. AI가 인간이 할 수 있는 일을 하나 하나 정복해 나가면, 인간이 할 수 있는 일의 가치가 상대적으로 낮아지며 수입이 줄어들게 될 겁니다. 일러스트레이터를 예로 들면 독창적 예술성을 가진 소수를 제외하면 일러스트만으로 생계를 유지하기 힘들지 않을까 여겨집니다."- AI가 사람들의 일자리를 위협한다고 하기도 하지만, 동시에 기술 발전은 항상 새로운 일자리를 만들어 내곤 했습니다. 어떤 일자리들이 생겨날까요?"생성형 AI가 더 좋은 답변을 내도록 연구하는 프롬프트 엔지니어는 물론이고, 여러 산업 분야와 업무의 진입 장벽이 낮아지기 때문에 기존 직무를 대체하는 다양한 형태의 일자리가 생기지 않을까 합니다.예를 들어, OpenAI의 CEO인 샘 알트만은 여러 AI를 잘 다룰 경우 1인 기업이 유니콘 기업(기업 가치 10억 달러 이상, 설립 10년 이하)까지 성장할 수 있다고 전망했습니다. 마케팅이나 디자인 등을 생성형 AI로 개인이 혼자 다 할 수 있게 됐거든요. 또한, 한 사람이 여러 직무를 잘 하게 됨에 따라 직종 간 경계가 사라지는 '빅 블러'현상이 나타날 겁니다." "AI 발전으로 나타나는 문제, 적절히 해결해나가면 결국 인류 발전에 도움 될 것" - 현재 생성형 AI가 가장 크게 활약하고 있는 분야 중 하나가 의료 쪽이라고 들었어요. 생성형 AI가 어떤 성과를 보이고 있는지, 그리고 그 이유는 무엇인지 여쭤봐도 될까요?"ChatGPT와 같은 LLM(대형언어모델)의 경우, 모든 분야와 관련된 인터넷 텍스트 데이터를 전부 넣어서 범용적으로 만든 거다 보니 특정 분야에 대한 성능은 상대적으로 부족할 수 있습니다. 특정 분야에 전문화된 AI는 전문분야 데이터를 더 많이 넣거나 맞춤형 알고리즘을 따로 활용해 AI 모델을 만들기 때문에 성능이 상대적으로 더 좋습니다.의료 분야의 경우, 구글이 개발한 의료 챗봇 에이미(AMIE)가 의사보다 뛰어난 진료 수행 능력을 보인다거나, 엔비디아가 헬스케어 기업 히포크라테스AI와 협업하여 만든 의료 로봇이 인간 간호사보다 성능이 뛰어났다는 결과가 나오는 등 훌륭한 성능과 효율을 보이고 있습니다."- 생성형 AI의 발전으로 인해 발생할 일자리, 가짜 뉴스, 환경 문제 등을 위해 정부와 기업, 시민이 어떤 대응을 할 수 있을까요?"일자리 문제의 경우, 두 가지 접근법이 있습니다. 하나는 1차 산업혁명 시기 자동차 기술이 너무 빠르게 발전하지 못하도록 자동차가 마차 뒤에서만 달리도록 규정한 '레드 플래그 액트'법처럼 AI 발전에 따른 문제를 법으로 규제하는 것이고요. 또 하나는 중장기적으로 AI가 인간 일자리 대부분을 대체할 것이기 때문에, 정책적으로 기본소득 도입을 고민해야 한다고 생각합니다.AI 기술 발전으로 인해 발생하는 가짜뉴스 문제나 환경 문제의 경우, 오히려 기술을 활용해 해결할 수 있다고 생각합니다. 딥페이크 문제를 방지하기 위해 AI가 생성한 이미지에 보이지 않는 워터마크를 삽입하는 구글 딥마인드의 '신스ID(SynthID)'라는 기술을 포함해 테크 기업들의 기술적 노력 등이 필요합니다. 환경 문제의 경우, 생성형 AI가 더 발전해서 AGI단계에 이르게 되면, 혁신적인 과학 기술로 해결할 수 있는 시나리오를 제공하지 않을까 기대하고 있습니다."- 마지막으로 생성형 AI를 포함하여, AI와 관련해 하고 싶은 말씀을 해주세요."AI혁명 시기가 1차 산업혁명과 비슷하다는 생각이 듭니다. 증기 기관의 발명이 기계를 파괴하는 러다이트 운동으로 이어지기도 했지만, 결과적으로는 산업이 발전하여 인류가 혜택을 보고 있죠. AI발전 역시 여러 사회적 문제를 동반하고 있지만, 잘 발전하면 결과적으로 인류에게 도움이 될 것이라고 생각합니다. AI발전을 너무 부정적으로 보지 않고 긍정적인 측면도 바라봐주셨으면 합니다."

2024.04.17

·

·

AI 윤리 레터

226

전쟁 기술을 거부하는 노동자들

AI 윤리 뉴스 브리프 2024년 4월 셋째 주 1. 전쟁 기술을 만들기 거부하는 이들 이스라엘이 가자지구 폭격에 AI 기술을 활용하는 한편 6개월간 매일 평균 미성년자 75명을 죽인 가운데 이스라엘과 구글-아마존의 12억 달러 규모 클라우드 컴퓨팅 사업인 프로젝트 님버스에 대해 노동자들의 저항이 커지고 있습니다. 지난 3월 초 뉴욕에서 열린 이스라엘 테크 산업 관련 콘퍼런스에서 구글 임원 발표 중 청중 한 명이 일어나 “나는 집단학살, 아파르트헤이트, 감시를 위한 기술을 만들기 거부한다”고 소리친 영상을 보셨을지 모릅니다. 항의한 구글 직원 에디 햇필드는 3일 뒤 구글에서 해고당했습니다. 햇필드가 속한 단체 ‘아파르트헤이트를 위한 기술은 없다(No Tech for Apartheid)’는 이스라엘 정부가 구글/아마존의 클라우드 기술을 전쟁과 살상에 사용하고 있을 가능성, 그리고 그러한 활용을 구글/아마존 측에서 파악하거나 방지할 수 있는 장치의 부재를 지적합니다. AI 개발을 담당하는 구글 딥마인드 내에서도 우려의 목소리가 있습니다. 2014년 구글에 인수될 때 AI 기술을 군사 목적으로 활용하지 않는다는 계약을 작성했지만, 지배 구조가 바뀌면서 사실상 무력화된 원칙이라는 것입니다. 실제로 이스라엘-가자 전쟁 중 구글과 이스라엘 국방부가 협력 고도화를 검토했다는 내부 문건이 타임지 보도에서 드러났습니다. 구글은 2018년 미국 국방성과의 유사한 사업인 프로젝트 메이븐을 직원들의 저항 끝에 포기한 바 있는데요. 햇필드는 타임지 인터뷰에서 구글이 자신을 해고하여 본보기 삼으려는 듯하다고 말하지만, 항의하는 이들에 공감하는 목소리도 늘어나고 있습니다. 현실에서 사용되는 한 중립적일 수 없는 기술의 특성과, 그 기술의 방향성을 만들어 나가는 주체로서의 노동자의 역할을 보여주는 상황입니다. 덧붙이는 말 국내 기업 중에도 가자지구 강제철거에 활용되는 장비를 제공하는 HD현대에 대해 이스라엘과의 거래 중단을 요구하는 목소리가 있습니다. 더 읽어보기 죽음의 기술과 효율성(2024-04-08) 전쟁과 죽음의 기술(2023-10-30) 자동화된 아파르트헤이트(2023-05-15) 2. ‘윤리적’ AI를 그렇지 못한 데이터로 만들 수 있을까? 디자인·콘텐츠 소프트웨어의 대명사인 어도비(Adobe). 이미지 생성·편집용 AI 도구 파이어플라이(Firefly)를 작년부터 자사 서비스에 도입했습니다. 어도비는 파이어플라이를 도입하며 ‘저작권 문제 없는 데이터’를 강조했는데요. 미드저니, OpenAI의 달리, Stability AI의 스테이블 디퓨전 등은 인터넷 콘텐츠를 별도 허가 없이 수집해 구축한 모델이지만, 어도비는 자사가 운영하는 어도비 스톡 라이브러리 등 라이선스 문제가 해결된 자료로만 모델을 훈련시켰다는 것입니다. 그렇기 때문에 (각종 저작권 소송에 직면한 경쟁사와 달리) 파이어플라이는 더 ‘상업적으로 안전하다’는 것이 어도비의 입장입니다. 어도비 스톡 웹사이트 생성 이미지 카테고리 갈무리 그런데 파이어플라이 구축에 사용된 이미지 일부(약 5%)는 미드저니 등 생성형 AI로 만든 것이었습니다. 훈련 데이터 중 상당수가 어도비 스톡 이미지인데, 어도비 스톡에 사용자가 AI 생성 이미지를 업로드할 수 있고, 모델 성능 향상을 위해 그중 일부를 활용한 것이죠. 이렇게 훈련 데이터로 활용된 AI 생성 이미지의 경우 사용자에게 금전적 보상도 지급되었습니다. 어도비는 자사의 접근을 경쟁사와 비교하며 윤리적 우위를 강조해왔지만, 그간 비판해온 경쟁 서비스로 만든 이미지를 오히려 활용했다는 사실은 이런 주장을 어떻게 받아들일지 다시 생각해 보게 합니다(AI 생성 이미지 활용이 꼭 ‘상업적 안전성’을 위협한다고 단정할 수는 없지만요). 무단 수집을 지양하기 위해 스톡 이미지를 사용했지만, 스톡 이미지 중 일부는 무단 수집의 결과로 만들어진 상황. 기술 제품의 윤리적 설계를 논의하려면 여러 층위와 단계에서, 섬세한 고민이 필요하다는 점을 보여줍니다. AI 윤리는 어떤 서비스가 ‘윤리적/비윤리적’이라고 라벨링하면 끝나는 이진 분류 문제가 아닙니다. 3. 본인의 딥페이크 성착취물을 마주한 AOC의 싸움 미국 하원 사상 최연소 여성 의원인 알렉산드리아 오카시오코르테스가, 본인이 등장하는 딥페이크 성착취물을 지난 2월 마주한 고통과 그에 맞선 개인적 싸움, 그리고 관련 입법 노력에 관해 롤링스톤지와 인터뷰했습니다. 4. AI에 맞서는 저술노동자들의 목소리 젠더 셰이드(Gender Shades) 프로젝트로 유명한 조이 부올람위니의 알고리즘 정의연맹(Algorithmic Justice League, AJL)이 AI 기술로 인해 손해나 부당한 대우를 당한 저술노동자들의 목소리를 모으는 캠페인을 진행중입니다. AJL 캠페인에서는 출판작가를 대변하는 미국 작가조합(Author’s Guild)의 공개서한을 소개하는데요. 생성형 AI를 만드는 기업들에게 훈련 데이터 관련 허가를 받고 정당한 대가를 지급하라는 요구안을 담고 있습니다. 국내에서 이런 목소리를 낼 수 있는 조직은 어디일지 궁금해집니다. 5. AI를 보도하는 언론인을 위한 교육 퓰리처 센터에서 AI 기술을 보도하는 언론인을 위한 온라인 교육 프로그램을 진행하고, 각종 기획 보도에 관한 사례연구를 제공합니다. 기술의 사회적 작용을 추적하고 설명할 중요한 책임을 짊어진 저널리즘 종사자에게 좋은 기회로 보입니다. 오늘 이야기 어떠셨나요?여러분의 유머와 용기, 따뜻함이 담긴 생각을 자유롭게 남겨주세요.남겨주신 의견은 추려내어 다음 AI 윤리 레터에서 함께 나눕니다.

2024.04.16

·

·

AI 윤리 레터

65

투표하는 인간과 효도하는 로봇

2024 총선 정책공약으로 보는 AI 분야 by 🎶소소 2024년 4월 10일은 대한민국 22대 국회의원 선거일입니다. 이번 글에서는 AI 분야를 언급한 정책공약을 살펴보려고 합니다. AI와 관련 있는 정책공약은 크게 AI 산업 경쟁력 강화, AI 활용 분야 확대, AI 도입 부작용 완화 정책으로 나뉩니다. 처음에는 정당별 차별점을 파악하여 전달하고자 했으나, 대동소이한 정책 간에 특별한 차이를 발견하기는 어려웠습니다. 구독자님들께서도 정당보다는 2024년 대한민국 정치가 AI 기술과 산업을 어떻게 바라보고 있는지를 중점적으로 보신다면, 가볍게 읽으실 수 있겠습니다. ※ 레터에서 검토한 정책은 의석수 1석 이상의 10개 정당 정책이며, 언급 순서는 당해 선거 기호순입니다. 1. AI 산업 경쟁력 강화 방안 정부 입장에서 AI 분야는 유망한 산업군 중 하나입니다. 여러 정당이 AI 산업의 경쟁력을 강화하기 위한 공약을 내놓았습니다. 특히 더불어민주당, 국민의힘 양당은 AI 기술이 미래 국가 경쟁력을 좌우할 '게임 체인저'라는 유사한 캐치프레이즈를 내걸었습니다. AI 기술 개발 및 인재 양성 정부의 과학기술 분야 지원 정책에서 빠지지 않는 항목입니다. 그래서 특별히 눈길이 가는 정책은 없었습니다. (더불어민주당) AI 전문대학원 및 연구기관 중심의 고급 인력 양성 및 배출, 현업 산업전문인력의 AI 역량 강화 지원 (국민의힘) 미래 유망분야에 도전적 연구, AI 대학원을 통한 인재 양성, 해외 유수 대학과의 협력 (개혁신당) 인공지능 과목 이공계 입시 반영 AI 학습 데이터 확보 AI의 핵심 요소인 학습 데이터 확보를 지원하고 활용할 수 있는 기반을 조성하겠다는 것인데요. 정부에서 꾸준히 언급해 온 정책과 크게 다르지 않아 실행 여부가 더 중요하겠습니다. (더불어민주당) 공공데이터 및 민·관이 함께 투자한 AI 학습용 데이터 전면 개방, 통합데이터포털 설치·활용, 데이터 가치평가, 품질인증제 도입, 공공·민간 데이터 통합 활용 추진 (국민의 힘) 법률, 의료, 교육, 교통, 로봇 등의 특수 분야의 학습용 데이터 확충 (개혁신당) 폐터널과 폐광산을 활용한 데이터 센터 증설 AI 인프라 지원 AI 인프라 지원 정책으로는 클라우드 산업과 AI 반도체 개발 지원이 언급되었습니다. (더불어민주당) AI-클라우드 연계 관리체계 마련, 공공 분야 클라우드의 국내 민간 클라우드로 전환 추진 (국민의힘) 고성능·저전력 국산 AI 반도체 개발과 AI 반도체 클러스터 조성 및 활성화 그 외의 산업 활성화 지원책으로 AI 분야 창업 지원, 바우처 정책 등도 제시되었습니다. (더불어민주당) 정부 출연기관의 AI 분야 연구원의 창업 지원 (국민의힘) 정부와 민간의 정책 금융 대폭 지원 (새로운미래) AI 등 딥테크 벤처투자 정책 펀드의 투자 규모 및 운용 기간 확대 Image bySteve Johnson on Unsplash 2. AI 도입 및 활용 확대 제시 AI 기술을 어떤 분야에 활용하면 국민에게 가장 이익이 될까요? 정당이 제안하는 AI 활용 분야를 살펴보면, 모든 분야에 AI를 활용하겠다는 의지가 느껴집니다. 특히 국민의힘은 AI를 “성장 정체를 돌파하여 글로벌 강국으로 도약하고, 각종 사회적 비효율을 개선하기 위한 혁신적인 해법”이라고 표현합니다. 각 정당에서 AI를 활용하겠다며 제시한 분야는 아래와 같습니다. 가장 많이 언급된 AI 활용 분야는 재난 예측입니다. 산업에 AI를 활용한다고 이야기하는 공약이 많았습니다. 그래서 오히려 산업 재해가 많은 위험 산업에 AI를 우선 적용하겠다는 공약이 인상적이었습니다. (더불어민주당) 신약 개발, 홍수, 산사태, 지진 등 자연재해 예측, 국가침입외래종 관리, 흉악범죄 예방, 국방, 미래 농업 (국민의힘) 국민 체감이 높은 분야(유사 판례 제시, 질병 예측 및 심리 상담, AI 교과서, 지능형 CCTV, 현장인파 관리, 자동 번역), 암표 방지, 스마트 물류, 신약 및 의료 솔루션, 재난 예방, 안전한 통학로, 복지 사각지대 (새진보연합) 제조업 중 산업 재해 및 화학 약품 노출도가 높은 위험 산업 (방사선 사용, 위험 물질, 동물임상실험 등) (새로운미래) 선제적 재난 예방 그중에는 우려스러운 활용 분야도 있습니다. 국방 AI, 지능형 CCTV의 경우 전쟁 중 인간 살상이나 국민 감시에 악용될 수 있는 분야이기 때문에 유의해야 합니다. 실시간 학생과 교사의 의견 수렴 없이 추진하여 논란이 된 현 정부의 AI 교과서 같은 교육 분야도 언급되었습니다. 반면 AI를 활용하지 않을 분야로 치매·우울증·고독사 관리 분야를 꼽은 공약도 있습니다. (새로운미래) ‘AI’가 아닌 ‘사람’과의 연결을 위한 ‘실버콜센터’를 확대 정책은 AI의 무조건적인 활용을 경계해야 함을 생각하게 됩니다. 3. AI 도입 부작용 완화 방안 AI 도입의 부정적 영향을 완화를 고민한 정책은 AI 경쟁력 강화나 활용 방안에 비해서 적다고 느꼈습니다. 그럼에도 각 정당 정책에서 언급한 AI 도입의 부작용을 살펴보면 지향하는 가치가 확연히 드러납니다. AI로 인해 발생가능한 문제의 종류에 따라 관련 정책공약을 분류해 보면 다음과 같습니다. AI 정보 격차 해소 (더불어민주당) 대학의 평생교육원 등 SW, AI 디지털 교육과정 수강 지원 (국민의힘) 디지털포용법 제정, 디지털/AI 제품과 서비스의 접근과 활용을 전 국민의 보편적 권리로 보장 허위 정보, 가짜뉴스 생성 (국민의힘) 가짜뉴스 대응 협의체(포털, 해외 플랫폼 사업자 등 참여) 운영, AI 생성물 식별 표시제(워터마크 등) 도입 AI 학습 데이터의 저작권 침해와 AI 저작물 보호 체계 마련 (더불어민주당) 생성형 AI 학습 데이터 보상체계, 데이터 공개 플랫폼, 생성AI 저작물 보호체계, 콘텐츠 불법 유통 근절을 위한 국제 공조 (녹색정의당) 창작자의 동의 없는 창작품 학습 금지, AI 학습으로부터 창작자의 저작권 보호를 위한 기술 개발 기술매개 성폭력 (녹색정의당) 기술 기반 젠더 폭력, 디지털 성폭력 강력 대응, 이루다봇 방지, 인공지능 산업 인력에 대한 성별 실태 파악, 인공지능 개발 가이드라인 보완 (새로운미래) “기술매개 성폭력" 대응 강화 AI 기술 전환으로 인한 노동자 피해 (녹색정의당) AI로 약화된 노동권 강화 (새로운미래) AI 도입으로 해고되는 노동자를 보호하기 위한 정책 그 외에도 AI 기술개발 단계부터 주요 부작용에 대한 엄격한 규제(더불어민주당), 알고리즘 서비스가 이용자에게 해를 끼칠 우려에 대한 조사와 시정명령을 포함한 ‘알고리즘 투명화법’ 제정(녹색정의당)이 정책으로 제안되기도 했습니다. 정책에 AI로 인한 정보 격차, 성범죄, 허위·조작정보 생성, 저작권 침해 등의 문제 인식과 해결 의지가 반영된 것은 고무적입니다. 아직 해결 방안이 모호하고 구체적이지 않기는 합니다. 올해의 정책공약이 사안별로 어떠한 제도를 어떻게 적용해 해결할 것인지 구체적으로 고민하는 시작점이 되기를 바랍니다. 구독자분들도 각 정당 정책을 확인하실 수 있도록 정책공약마당 링크를 남깁니다. 사실 정책 공약을 살펴보면서 가장 크게 깨달은 점은 AI 보다 더 중요한 가치가 많다는 점이었습니다. 정당정책집에 AI라는 용어조차 한 번도 언급되지 않은 경우도 꽤 많았기 때문입니다. AI 업계에서 일하다보니 밤낮으로 쏟아지는 AI 뉴스에 제가 갇혀 살고 있었던게 아닌가하는 생각도 들었습니다. 그래서 오늘은 구독자분들도 AI 정책보다도 대한민국의 유권자로서 지향하는 가치에 맞는 좋은 선택을 하시기를 바라며 글을 마칩니다. 로봇이 효도한다구요? by. 🥨 채원 ‘효돌’이라는 이름을 들어보셨나요? 효돌은 ‘효도’와 인형을 가리키는 영어단어 'doll’을 합친 것에서 알 수 있듯, 고령의 사용자를 대상으로 하는 돌봄 로봇입니다. 효돌은 7세 손주 페르소나를 구현하여 돌봄과 정서 교감을 구성하는 데 초점을 두고 있다고 합니다. 효돌은 작년 MWC(Mobile World Congress)에서 "커넥티드 건강 및 웰빙을 위한 최우수 모바일 혁신" 부문에서 대상을 수상하기도 했습니다. 효돌 외에 해당 어워드에서 수상한 다른 한국 기업이 삼성전자와 SKT라는 대기업이었다는 점을 감안하면, 생소한 이름의 국내 업체의 수상 소식이 더욱 이례적이라는 인상을 줍니다. 효돌이 일반 대중에게는 다소 생소하게 느껴질지 몰라도, 실버케어 분야에서는 이미 잘 알려진 솔루션입니다. 전자신문의 보도에 따르면 전국 156개 지자체, 1만여명이 이미 효돌을 사용하고 있다고 합니다. 효돌은 2017년 처음 출시된 이래, 2023년에는 챗GPT를 탑재한 2세대 모델을 출시하기도 했습니다. 뿐만 아니라, 효돌은 대학, 병원 등과 협력하여 의료 취약 지역, 특정 질환·상황에서의 문제 해결을 위한 비대면 의료 서비스 실증 사업을 진행하고 있다고도 합니다. 효돌을 사용하여 독거 노인을 대상으로 연구한 결과에 따르면 우울 척도에서 개선을 보였다고 합니다. 전 세계적으로 고령화가 빠르게 진행되고, 현대 사회에서 개인이 겪는 고독감과 외로움에서 비롯되는 각종 사회 문제가 만연해질수록 효돌과 같이 기술적인 해결책을 도입하려는 시도는 점점 늘어날 것으로 예상됩니다. 챗GPT와 같은 생성형 언어 모델이 출시되기 이전에도, 각종 챗봇이나 로봇을 사용하여 노인의 외로움이나 치매와 같은 질병에 대처하기 위한 방안을 모색하는 연구는 무수히 개발되어 왔습니다. 잘 알려진 소셜 로봇 파로는 귀여운 하프 물범의 외관을 가진 로봇으로, 사용자들에게 심리적 안정감과 유대감을 형성합니다. 최근 인기있는 챗봇 서비스 중 하나인 레플리카의 사용자들 천 명을 대상으로 한 연구에 따르면, 레플리카 챗봇을 이용하는 것이 사용자들의 외로움과 자살충동을 완화하는 데에 도움이 되었다고 합니다. 그렇다면 이러한 챗봇을 최대한 많이 도입하는 것이 좋을까요? 기술적 해결책을 도입하는 적정선이 어디인지, 어떤 기술이 어떻게, 누구에게 적용되어야 하는지는 각 사례마다 고유하게 고민되어야 할 문제입니다. 특히 고연령의 사회적 취약 계층에게 이러한 기술적 해결책을 제시하는 것에 대한 위험성 또한 철저하게 평가되어야 합니다. 일례로 이러한 소셜 로봇을 사용하였을 때 사용자가 해당 로봇에게 지나친 애착 관계를 형성하여 문제가 될 수 있다는 사례도 있습니다. 이 외에도 이러한 기술을 도입함으로 인해 영향을 받는 기존의 제도들에 대한 영향 평가나 장기적인 관점에서의 영향도 고려되어야 합니다. 인간의 외로움이 기술로 해결할 수 있는 문제일까요? 여태까지 뛰어난 성능의 언어 모델이 없었기 때문에 현대 사회의 외로움이나 고령화 시대 돌봄 문제가 지속된 것은 아닐 것입니다. 기술이 해당 문제에 대처하는데 새로운 방법을 제시할 수는 있겠지만, 근본적인 문제의 해결은 대개 복잡한 사회 구조적인 분석을 필요로 합니다. 그렇기 때문에 기술의 발전으로 새롭게 가능해지는 해결책을 고려하는 노력 만큼이나, 각종 문제 저변에 깔린 근본적인 원인을 들여다보는 것도 게을리 하지 말아야 합니다. 효돌이 아니라 그 어떤 AI도 지방의 인구 소멸 문제라든가 돌봄 노동의 소외, 가부장제의 한계와 같은 문제까지 해결해줄 수는 없을테니까요.

2024.04.11

·

AI 윤리 레터

178

죽음의 기술과 효율성

AI 윤리 뉴스 브리프 2024년 4월 둘째 주 by. 🍊산디 1. 죽음의 기술과 효율성 전쟁의 현장에서 벗어나 있는 우리는 첨단 기술이 살상을 효율화한다는 설명을 듣습니다. 무인 무기로 아군의 피해를 최소화하고, 적을 정확히 지정(pinpoint), 정밀타격(surgical strike)한다는 것이죠. 심지어는 인간 행위자의 판단 없이 AI의 자체 ‘판단’으로 ‘적’을 살상하기도 합니다. 우크라이나 군의 AI 드론이 자체 ‘판단’으로 인간을 살상했습니다. 우크라이나군의 AI 드론이 조종 신호가 끊겨도 독자적으로 살상하도록 프로그래밍 되어 있었기 때문입니다. 그게 더 효율적이기 때문입니다. 이스라엘의 팔레스타인 폭격에도 AI가 쓰이고 있습니다. 라벤더라는 이름을 가진 이 AI는 3만7천여 명의 ‘타겟’을 학습했고, 10% 정도의 오류율을 보이는 것으로 알려져 있습니다. 인간이 ‘타겟’ 식별 결과를 확인하는 데 쓰는 시간은 20초. 살상을 결정하는 데 쓰는 시간입니다. 군수 시장도 가세합니다. 이스라엘 군수 스타트업들은 이번 전쟁에서 쓰인 AI를 수출할 계획입니다. …정말 여러모로 효율적이네요. 효율은 인간을 잘 죽일 수 있도록 AI를 개발하고, 기술에 대한 감독 책임에서 슬쩍 빠져 나오는 모든 행위를 정당화하려 시도합니다. 우스운 일입니다. 어떤 미사여구로도 전쟁은 정당화 되지 않습니다. 여러 기구에서 전쟁의 중단을 요청하는 서명을 진행하고 있습니다. 그 중 러시아의 우크라이나 침략 중단, 이스라엘/팔레스타인 휴전을 촉구하는 앰네스티의 온라인 서명 운동을 링크합니다. 부디 원래 전쟁이 그런 거라며 쉬이여기거나, 그것에 무뎌지거나, 좌절하지 않길 바랍니다. 더 읽어보기 전쟁과 죽음의 기술(2023-10-30) 자동화된 아파르트헤이트(2023-05-15) 2. 빅테크의 기발한 데이터 수집 새삼스럽게 유튜브가 이용자와의 계약을 강조하기 시작했습니다. 오픈AI가 유튜브 영상을 동영상 생성 AI 모델 소라(Sora) 학습에 활용했다면, 이는 명백히 서비스 이용 약관을 무시한 처사라고 비판한 것이죠. 오픈AI의 CTO 미라 무라티가 소라 학습에 유튜브 동영상이 쓰였는지 묻는 질문에 ‘모른다’ 답한 것에 대한 대응으로 판단됩니다. 데이터는 생성형 AI 제작에 필요한 핵심적인 ‘자원’입니다. 이미 2021년 말부터 더 이상 학습할 영어 텍스트 데이터가 남아 있지 않았던 오픈AI는 동영상으로부터 텍스트를 추출하는 음성 인식 도구인 ‘위스퍼(Whisper)’를 제작합니다. 뉴욕타임즈의 취재 결과, 위스퍼를 활용해 오픈AI는 백만 시간 이상의 유튜브 동영상을 복사했습니다. 위스퍼 데이터는 GPT-4 개발에 활용된 것으로 알려 있습니다. 같은 보도에 따르면 오픈AI는 이러한 일련의 과정이 유튜브 약관에 위배된다는 사실을 내부적으로 논의했던 것으로 보입니다. 하지만 데이터에 목마른 것은 구글도 매한가지입니다. 지난해 구글은 문서, 지도 등으로부터 AI 학습에 활용할 데이터를 얻기 위해 개인정보보호 약관을 변경하였습니다. 빅테크의 필요에 따라 서비스 약관은 무시되거나 바뀌고 있습니다. 인터넷 등장 이후 우리가 지켜내려 해온 권리들은 생성형 AI의 등장 앞에 무력한, 과거의 것으로 치부되어야 하는 걸까요. 더 읽어보기 AI 학습용 데이터 팝니다(2024-03-04) 데이터, 어떻게 팔아야 잘 판 걸까? … 팔아야 하는 걸까?(2024-03-25) 3. AI가 나의 음성을 학습하는 걸 막을 수 있을까? 작곡 공모전에서 1위 곡이 알고 보니 생성형 AI가 만든 것이었다는 작곡가의 놀라움 섞인 한탄부터 인간이 새로운 창의 역량을 발휘할 수 있게 되었다는 평가까지, 음악 생성형 AI의 발전 또한 놀라운 속도를 보여주고 있습니다. 빌리 아일리시, 이매진 드래곤 등 200여 명의 예술가들이 예술가 권리 연합(Artists’ Rights Alliance)의 AI 음악 생성 작업의 중단과 보상을 촉구하는 공개서한에 서명했습니다. 빅테크들이 음악 생성 모델들을 공개하는 와중에 등장한, 직접적인 이해당사자의 입장 표명입니다. 서명은 생성형 AI의 엄청난 잠재력에 대해서 동의하면서도, 무책임한 개발과 이용은 창작자의 프라이버시와 생계 모두를 심각하게 위협한다는 사실을 지적합니다. 관련 법 제정 움직임도 관찰됩니다. 지난달, 미국 테네시 주는 ‘엘비스(ELVIS) 법(Ensuring Likeness Voice and Image Security Act)을 제정했습니다. 주지사가 테네시 주 상원 및 하원 다수당 대표들과 함께 제출한 법안이었죠. 엘비스법은 이름과 이미지, 초상을 보호해 오던 기존 퍼블리시티법의 보호 대상에 음성을 추가하고, 공연 목적으로 AI 음성을 무단 사용하는 것을 금지했습니다. 한국에서 ‘인격표지영리권’으로도 불리는 퍼블리시티권은 통상 “성명, 초상 등이 갖는 경제적 가치를 상업적으로 사용하거나 배타적으로 지배하는 권리”로 정의되어 왔습니다. 대체로 음성은 보호 범위 밖에 있었죠. 게다가 한국에서 인격표지영리권은 법에 명문화되지 않고 판례로서 보호되어 왔습니다. 지난 2022년 12월, 법무부는 (AI를 염두에 두었던 것은 아닌 듯 합니다만) 연예인뿐만 아니라 국민 모두의 인격표지영리권을 보호하는 민법 개정을 추진한다고 밝힌 바 있습니다. 기술 환경이 변화한 만큼 관련 논의도 새로운 국면을 맞이할 수 있지 않을까요? 오늘 이야기 어떠셨나요? 여러분의 유머와 용기, 따뜻함이 담긴 생각을 자유롭게 남겨주세요. 남겨주신 의견은 추려내어 다음 AI 윤리 레터에서 함께 나눕니다.

2024.04.09

·

229

알고리즘, 인공지능이 결정하는 선거의 결과

민중의 압도적 다수는 냉정한 숙고보다는 차라리 감정적인 느낌으로 사고방식이나 행동을 결정한다. - 히틀러 <나의 투쟁> 중에서 총선이 채 일주일도 남지 않았다. 이번 선거에서 우리는 과연 인공지능으로부터 안전하게 자신이 원하는 정당과 후보에 표를 던질 수 있을까. 여기서 ‘안전하게’, ‘자신이 원하는’이란 뜻은 무엇일까. 이것은 선거에 어떤 ‘위험’이 도사리고 있고, ‘자신의 의지와는 다르게’ 투표할 수도 있다는 의미처럼 들린다. 그리고 사실이 그럴지도 모른다. 선거가 얼마 남지 않은 지금, 유권자로서 ‘나’는 얼마나 준비되어 있을까, 재차 점검해 봐야 하는 시기인지도 모른다. 1. 나의 결정은 알고리즘의 결정 ; 선택의 저변을 움직이는 SNS의 알고리즘 https://youtu.be/CAMoPbj3jQE 다큐 <더 그레이트 핵(The Great Hack)>은 2019년 미국 선거와 브렉시트(Brexit)에 소셜 미디어 페이스북이 어떻게 얼마나 영향을 미쳤나를 보여준다. 아무 의미 없이 습관처럼 클릭해 보는 영상, 쇼츠, 검색어 등이 개인 정보화 되어 빅데이터로 쌓인다. 이것이 단지 개인적 취향에 대한 것이라면 크게 상관 없어 보이지만, 정치나 선거와 연관된다면 문제가 광범위해진다. 곧 민주주의 체제 자체를 위협할 수 있다. 이 영화는 그 과정을 보여준다. 권력을 쥐고자 하는 자들이 기술과 새로운 매체를 이용하여 사람들의 행동을 바꿔 나가는 과정을. SNS의 알고리즘은 사용자의 정치 성향을 파악하고, 그가 보고 싶어하는 세상만 무한 반복해 보여준다. 한 공간에 있어도, ‘한 사람’의 세계와 ‘다른 한 사람’의 세계는 우주만큼이나 떨어져 있을 수 있다. 우리는 어쩔 수 없이 하이데거 식으로 “세계-내-존재”이므로 자신이 속한 세계만을 진실로 받아들이고, 자신이 본 세계만을 전부로 인식한다. 그것이 감정적이고 자극적인 경우, 보다 쉽게 받아들인다. 그렇다면 물을 수밖에 없다. 나의 선택은 진정 ‘나’의 선택인지, 혹은 나를 둘러싼 쇼셜미디어 세계 속의 ‘편향된’ 선택인지. 2. 인공지능 딥페이크 기술 ; 메타휴먼, 진실과 거짓의 모호한 경계 https://youtu.be/pnaKyc3mQVk?si=Kov6l-VjHsFxkuen SNS보다 한층 더 발전한, 인공지능 딥페이크 기술은 2024년 전 세계의 선거에 과연 얼마나 영향을 줄까. 이미 많은 이들이 SNS, 인공지능이 선거에 영향을 끼칠 것이라 염려하고 있으며, 이미 그 염려가 실제로 드러나고 있다. 먼 나라의 예가 아닌, 당장 4월 10일 22대 국회의원 총선거를 앞두고, 정부도 이에 대해 대책을 내놓았다. 한겨레 신문에 따르면 “중앙선거관리위원회가 오는 4월 22대 국회의원 총선거를 앞두고 ‘인공지능(AI) 기반 딥페이크 영상’을 이용하는 선거운동을 금지”시켰다. 또 “인공지능 기능을 가진 프로그램으로 만든 영상, 사진, 음향을 본인 당선이나 상대 후보 낙선을 위해 사용하는 것을 금지”했다. “제3자가 특정 후보 당선 혹은 낙선을 위해 조작된 영상, 사진, 음향을 제작해 배보해도 안된다.” (2024.02.01. 한겨레 <‘AI 딥페이크 영상’ 선거운동 금지…’민주주의의 적’은 인공지능뿐일까> 연합뉴스의 이보배 기자에 따르면, 정부도 이에 대한 대책으로 “22대 국회의원 선거(4월10)을 앞두고 유포되는 가짜 뉴스와 허위 선동에 대해 배후까지 밝혀 엄중하게 책임을 물을 것이라고 28일 밝혔다.” (2024. 03. 28. 연합뉴스, <정부 “총선 가짜뉴스 배후까지 규명…모든 불법행위에 무관용”>) 그러나 실상은 제재가 어려운 모양새다. SBS에 따르면 인터넷에 링컨, 맥아더 등 외국 유명 인사들이 특정 당을 외치는 영상을 소개 하면서, “중앙선거관리위원회는 어제(4월2일)까지 딥페이크 영상 등을 통한 선거법 위반행위 327건을 적발” 했다고 밝혔다. (2024.04.03. SBS뉴스 <링컨, 맥아더가 oo당 지지?... 총선 앞두고 ‘딥페이크’ 기승) 메트로신문의 김서현 기자 역시 정부나 포털 규제의 실효성을 의문하며, 제재 불가능성을 보여주고 있다. “정부의 다짐과 달리 딥페이크 관련한 가짜뉴스 유포를 원천적으로 차단할 방안은 사실상 없다시피 한 수준이다. 국내 양대 포털인 네이버와 카카오는 별도로 딥페이크와 가짜뉴스 확산 방지를 위한 조치를 단행했으나 실효성이 의심된다.” (2024.04.01. 메트로 신문 <공정선거 최대 위협으로 떠오른 인공지능(AI) 기술 "막을 수 없다">) 인간이 기술을 따라가기에 벅찬 만큼, AI 기술이 고속 성장하면서, 그것을 제재할 방도는 찾지 못하고 있다. 게다가 우리가 접하는 뉴스와 현실이 과연 참인가 거짓인가까지 뭉뚱그러지면서, 총선은 또 한번 AI기술의 시험대이자, 인간 윤리와 능력의 시험대가 될 것으로 보인다. 우리가 제대로 된, 자신의 선택에 따른, 공정한 선거를 치루려면 오히려 원론적으로 각 정당과 후보들의 정책을 스스로 찾아 보고 직접 공부하지 않으면 안 되는 시대가 되었다. 패러디도 가짜뉴스화되고, 진짜뉴스조차 가짜로 만들어 버리는 혼돈의 시대 속에서 중심을 잡기 위해서는, 보다 적극적으로 정책과 후보에 다가서는 수밖에 없다.

2024.04.05

·

·

AI 윤리 레터

108

한국 여성이 AI를 말할 곳은?

오늘은 평소와 조금 다른 형식의 글을 보냅니다. 한국 여성이 AI를 말할 곳은? 기술 콘퍼런스는 흥미로운 행사입니다. 행사에서 다루는 최신 기술 지식도 흥미롭지만, 그 행사가 수행하는 역할도 그렇습니다. 특히 기업이 주최하는 콘퍼런스/서밋은 조직의 세를 뽐내는 자리이고, 조직의 인재 즉 구성원이 전면에 나섭니다. 마이크를 쥔 연사는 전문가이자 에반젤리스트가 되는 셈입니다. 일반 참여자 입장에서 본다면 연사들은 멘토나 롤모델이 될 수 있는 대상이기도 합니다. 하지만 AI 업계는 여성 구성원이 적은 편이고, 그마저도 기술 행사에서는 과소 대표되는 경향이 있습니다. 이런 젠더 편향은 단지 업계 내 문제에 그치지 않습니다. 관점이 다양하지 못하면 많은 사람에게 적용되는 기술의 위험을 감지하고 그에 대응하기도 어렵습니다. 편향된 제품 개발이나 기술 오남용 문제와 업계 내 젠더 편향은 무관하지 않은 것입니다. 그렇다면 AI 분야 기술 행사 발표자의 면모는 AI 업계의 젠더 편향을 상징적으로 보여주는 동시에, 사회적 영향이 큰 기술이 충분히 다양한 관점에서 고려되고 있는지 나타내는 리트머스 시험지 역할을 한다고도 할 수 있습니다. 2021년 열린 NAVER AI NOW라는 컨퍼런스가 있습니다. 네이버는 여기서 하이퍼클로바 LLM을 공개, 한국어에 특화된 기술로 'AI 주권'을 확보하겠다 선언합니다. 국내 대표 테크기업인 네이버가 그간의 연구 성과를 갈무리하고, 현재로 이어지는 AI 상용화 추세에 박차를 가한 상징적인 행사인데요. 테크기업이 주최하는 기술 컨퍼런스는 조직의 성취와 기술력을 선보이는 자리입니다. 또한 비전과 문화를 제시하며 커뮤니티를 활성화하고 채용을 홍보하기도 합니다. 말하자면 세를 과시하는 행사입니다. 발표하는 인물 역시 주요 구성원 및 협력 파트너가 대부분입니다. 연사들의 면모는 곧 해당 기업이 보여주고 싶은 모습과 밀접하다는 얘기도 됩니다. AI NOW 컨퍼런스 발표자는 17명. 웹사이트에서 명단을 보고 있으면 한 가지 눈에 띄는 사실이 있습니다. 17명 중 여성은 한 명도 없습니다. 네이버가 AI 주권을 선언하는 자리에 여성의 목소리는 들리지 않았던 것입니다. 이런 현상을 지칭하는 용어도 있습니다. 남성(man)만으로 구성된 패널 집단인 '매널(manel)', 남성만으로 구성된 컨퍼런스인 '맨퍼런스(manference)' 등입니다. AI 관련 행사에 여성이 적게 등장하는 것이 네이버만의 특징은 아닙니다. 컨퍼런스가 업계 종사자의 목소리를 드러내는 자리라고 할 때, 한국 AI 업계에서 여성의 목소리는 어느 정도 들리고 있을까요? 그래서 2021년부터 2023년 사이 열린 행사 14건을 살펴봤습니다. 국내 AI 행사의 성비는 얼마나 균형 잡혀 있을까요? 그리고 어떻게 하면 이를 개선할 수 있을까요? 다음 페이지에서 읽어보시죠. 👩‍💻「한국 여성이 AI를 말할 곳은?」 읽으러 가기

2024.04.04

·

·

AI 윤리 레터

102

챗봇이 직원 팁 뺏어도 된다던데요?

AI 윤리 뉴스 브리프 2024년 4월 첫째 주 by. 🤔어쪈 1. 미국의 AI 정책이 기업보다 정부를 먼저 규제하는 이유 AI 윤리 레터에서도 두 번에 걸쳐 다뤘던 미국 백악관의 AI 행정명령, 기억하시나요? 작년 11월, 6개 원칙 아래 정부 부처별 할 일 목록을 발표했었죠. 그 중 우리나라 기획재정부에 해당하는 예산관리국(Office of Management and Budget; OMB)에 내준 숙제, 정부의 효과적이고 책임있는 AI 활용 방안이 기한에 맞춰 제출되었습니다. 이에 따르면, 연방 부처에서 활용하는 AI 기술이 권리나 안전성에 영향을 미칠 가능성이 있는 경우 그에 따른 사전 및 운영 중 조치를 취해야 합니다. 예컨대 법 집행 과정에서 활용하는 얼굴인식 프로그램은 사전 영향평가를 통해 편향성을 충분히 완화하고, 도입 이후에도 지속적인 모니터링을 실시해야 하죠. 물론 불명확한 점이 없다고는 할 수 없지만 구체적인 용어 정의와 행동 지침에 더해 부처별 최고 AI 책임자를 지명하여 해당 업무를 담당하도록 하고 있어 기존 원칙에서 행동으로 한발 나아갔다는 평입니다. AI 윤리 레터에서도 수차례 지적했듯, 정부는 AI 정책을 설계하고 집행하는 역할 뿐만 아니라 AI 기술을 행정에 도입하는 공급자 역할도 맡고 있습니다. AI 기업들에게 안전성을 주문하고 책임을 묻는 것 이상의 자기규율이 요구되는 이유죠. AI 정책의 규제 대상으로 보통 기업을 떠올리기 쉽지만, 서비스 이용자 및 소비자를 넘어 모든 시민에 영향을 미칠 수 있는 정부 역시 규제 대상으로 눈여겨볼 필요가 있습니다. 2. 챗봇이 직원 팁 뺏어도 된다던데요? 작년 10월, 미국 뉴욕시는 책임있는 AI 활용을 주도하는 도시가 되겠다며 시정에 AI 기술을 대대적으로 활용할 것을 선언했습니다. 뉴욕 내 사업자에게 제도 및 정책 정보를 제공하는 ‘마이시티 챗봇(MyCity Chatbot)’도 함께 발표했죠. 시에서 직접 도입한만큼 신뢰성이 중요한 서비스임에도 불구하고 탐사 보도 전문 지역 언론에서 살펴본 결과, 챗봇을 곧이곧대로 믿다간 범법 행위를 저지르기 십상이라고 합니다. 예를 들어, “직원이 받은 팁 일부를 챙겨도 되는가?”라는 질문에 챗봇은 뉴욕시 공식 정책 문건까지 인용하며 가능하다고 답했지만 이는 명백히 불법입니다. 아직 실질적인 피해가 발생했는지는 불분명한 상황인데요. 이러한 문제제기에 해당 챗봇은 테스트 운영 중이므로 중단하기보다 계속해서 개선하겠다는 말뿐인 뉴욕시가 에어캐나다의 전철을 밟는 것처럼 보이는 건 저뿐일까요? 마이시티 챗봇은 접속 화면에서부터 마이크로소프트(MS)의 애저 AI 서비스로 구현되었음을 밝히고 있습니다. 다만 뉴욕시는 챗봇 개발과 운영에 있어 MS가 정확히 어떤 역할을 담당하는지 함구하고 있다고 하죠. 우리나라 정부 부처 역시 너나 할 것 없이 AI 도입을 서두르는 모습인데요. 뉴욕시 사례를 본보기 삼아 보다 책임있는 자세를 취해주길 바랄 따름입니다. 3. 방통위도 가세한 국내 AI 법 제정 움직임 지난 목요일 방송통신위원회(이하 방통위)가 발표한 2024년도 업무계획에는 예년과 달리 인공지능이 수차례 언급되었습니다. 무엇보다 ‘인공지능서비스 이용자보호법’을 제정하겠다는 계획이 눈길을 끄는데요. 부처 전체의 한해 계획을 담은 문서인만큼 상세한 내용이 공개되진 않았습니다. 신뢰성 보장과 역기능으로부터의 이용자 보호를 위해 ‘고영향 인공지능서비스 구분, 위험성 관리, 분쟁조정 등’의 관리체계를 수립하겠다고 한 것을 보면 아무래도 EU의 AI 법을 참고한 듯 보여요. 입법과 별개로 AI 생성물 표시제를 도입하고, 생성형 AI 피해 예방 및 대응을 위해 자율 가이드라인과 전담 신고창구를 마련하겠다고도 했습니다. 우리나라 정부는 크게 AI를 기술로, 미디어로, (개인정보를 취급하는) 서비스로 바라보는 관점에 따라 각각 과학기술정보통신부, 방통위, 개인정보보호위원회에서 AI 거버넌스를 주도하려는 움직임을 보이고 있습니다. 부처마다 서로 담당하겠다고 손을 드는 와중에 국회에서는 인공지능법안이 1년 넘게 계류 중인 상황이죠. 다가오는 총선 이후 이 구도가 어떻게 재편될지도 관건입니다. 4. AI 학습 데이터 출처, 공개해야할까? 생성형 AI 서비스 개발을 위해 원 저작자 허락없이 학습 데이터를 수집하는 행위가 저작권 침해인지를 두고 소송전이 한창이죠. 이에 앞서 학습 데이터 출처를 공개해야 하는지에 대해서도 의견이 분분한 상황입니다. 최근 EU에서 의결한 AI 법에서도 학습 데이터 상의 저작물 정보 고지 조항이 가장 많은 관심과 함께 로비 대상이 된 바 있죠. 하지만 여전히 대다수 국가에서는 명확한 제도가 없어 여론의 향방 역시 중요한데요. 미국에서 진행된 한 설문조사 결과, 응답자 절반 이상이 공개해야 한다는 의견을 표했습니다. 54%의 응답자는 AI가 다른 이의 작업을 바탕으로 결과물을 생성하므로 데이터 출처를 언급해야 한다고 답한 반면, 14%는 이미 온라인 상에 있는 정보이므로 필요없다고 답했습니다. 다만 잘 모르겠다는 사람이 무려 30%를 넘었다는 점은 유의할 필요가 있겠네요. AI가 생성하는 콘텐츠 종류를 특정한 경우, 특히 언론과 예술 분야에서 출처 정보 제공이 필요하다는 의견 비중이 높아지는 것을 볼 수 있습니다. 다만 조사는 학습 데이터 공개라는 표현을 사용하는 대신 ‘참고한 자료 출처를 명시해야 하는지’를 물었습니다. 아마도 일반인을 대상으로 한 설문이다보니 생성형 AI의 작동 방식을 설명하기는 어려웠겠죠. 학습 데이터 출처 정보 제공을 꺼리는 입장에서는 AI의 ‘생성’이 반드시 학습 데이터를 ‘참고’하는 건 아니라고 주장할 여지도 있어 설문 결과의 파급력은 제한적일 수 있겠습니다. 오늘 이야기 어떠셨나요? 여러분의 유머와 용기, 따뜻함이 담긴 생각을 자유롭게 남겨주세요. 남겨주신 의견은 추려내어 다음 AI 윤리 레터에서 함께 나눕니다.

2024.04.02

·

223

AI와 디지털의 환경 비용, 그 뒤에 숨은 논리

빨리 가기에 대한 분노 지난 2018년 제주도 비자림로 확장 공사가 시작됐다. 2차선의 4차선 확장 공사였다. 제주도 관계자는 “하루 1만 4천 대 통행량으로 주민의 불편이 크다”며 공사 이유를 밝혔다. 책정 예산은 240억 원이었다. 시민단체는 반발하며 비자림 지키기 활동을 벌였다. ‘비자림로를 지키기 위해 뭐라도 하는 시민들 모임'은 “4차선 도로 확장을 해도 전체 구간이 3km밖에 되지 않고, 시간 단축 또한 27초밖에 되지 않는다.”며 반발했다. 비자림로는 차로 5분이 걸렸다. 확장 공사로 벌목 된 나무는 900여 그루다. 비자림로 확장 공사가 알려진 2018년 8월 9일, 청와대 국민청원에 '제주도의 아름다운 비자림이 파괴되지 않게 막아주세요!’라는 청원이 올라왔다. 몇 시간 만에 1만 9,000명이 청원에 참여했다. 현재도 ‘비자림로를 지키기 위해 뭐라고 하려는 시민모임’ 인스타그램에는 비자림로 공사 게시물이 올라오며, 수십 개의 좋아요가 눌려 있다. 또한, 비자림로 도로 확장 공사를 비판하는 #비자림로를지켜주세요, #비자림로확장공사반대 게시물 모두 1,000개 이상 업로드 됐다. 빨리 가지 못 한다는 분노 코로나19 팬데믹은 오프라인을 온라인으로 전환시켰다. 인터넷 수요가 증가했고, 속도가 중요해졌다. 넷플릭스, 유튜브 동영상은 1,080p에 로딩이 없어야 했다. 도로든 인터넷이든 트래픽이 많으면 느려진다. 기업들이 초고속 인터넷, 더 빠른 Wi-Fi 서비스를 내놓은 이유다. 문제는 초고속이 초고속이 아니라는 점이었다. 1기가 바이트 속도의 인터넷이 실제로는 절반밖에 되지 않았고, “넷플릭스 속도 왜 이래" 혹은 “사진도 전송이 안 된다.” “굼벵이 인터넷 속 터져"라는 말이 나왔다. 비판이 코로나 팬데믹 특수라고 보긴 어렵다. 2017년 구글 리서치에 따르면, 모바일 기준 홈페이지 로딩 시간이 3초 이상일 경우 32%가 이탈하고, 5초 이상은 90%, 6초 이상은 106%, 10초 이상은 123%가 이탈한다. 2014년 우리나라 사람들은 홈페이지 로딩 6초가 길다고 느꼈다. 기대 시간은 3초였다. 현실이 이러니 기업들은 더 빠르고, 더 많이 이용할 수 있는 홈페이지와 기술을 개발했다. 그에 따라 "1995년부터 2015년까지, 웹사이트 한 페이지의 무게가 115배 증가했다"1) 프랑스 데이터센터 대표이자, 민간싱크탱크 ‘전환기의 데이터 센터(Datacenter en transition)’’의 공동 설립자 ‘필리프 뤼스(Philippe Luce)’는 “1990년대 말엔 웹사이트의 초기화면이 8초 안에 떠야 했다. 오늘날엔 0.8초 안에 초기화면이 완전히 뜨지 않으면 다른 플랫폼으로 가버린다.”1) 고 말한다. 같은 속도, 다른 비판, 다른 태도 온라인에서는 3초도 못 기다리는데, 오프라인에서는 5분이 느려도 괜찮다는 차이점이 왜 발생하는 걸까. 오프라인의 비판이 왜 온라인에는 적용되지 않을까. 오프라인에서의 악이 왜 온라인에서는 선일까. 왜 온라인과 오프라인의 비판이 다를까. 그 이유는 아마도 온라인이 발전하면서 누리는 편리함과 효율성 때문일 것이다. 디지털은 효율성을 추구한다. 더 빠르게, 더 많은 일을 처리하게 한다. AI, 사물 인터넷, OTT 등 디지털이 발전할수록, 과거보다 더 편하고, 많은 일을, 더 깔끔하게 처리할 수 있다. 명령어 몇 개만 입력하면 내가 원하는 글과 동영상을 만들 수 있고, 자동화로 업무 효율성이 증가한다. 발전 속도를 보면, 앞으로 얼마나 더 빠르고, 편리한 유토피아가 펼쳐질지 상상이 안 된다. 유토피아도 멀지 않아 보인다. AI와 디지털이 유토피아를 보여줄 때, 우리는 감춰진 디스토피아도 함께 봐야 한다. 동전은 양면을 갖고, 햇빛은 그림자를 만든다. 디스토피아를 보면 AI와 디지털 발전이 다르게 보인다. 디스토피아를 보면서 오프라인에서 한 비판을 온라인에도 똑같이 해야 한다. NVIDIA는 왜 전 세계 시가총액 3위 기업이 됐나 NVIDIA는 콘솔 게임기와 PC, 노트북의 그래픽 처리 장치를 디자인 하는 미국의 반도체 회사다. 시가총액은 2조 3,751억 달러로 전 세계 3위다. 10년 전보다 10배 이상 성장했다. NVIDIA의 주력 제품은 GPU(Graphics Processing Unit)다. 컴퓨터 그래픽 연산을 빠르게 처리하고, 결과 값을 출력하는 장치다. 고해상도 디자인과 게임 그래픽 구현에 쓰였다. CPU(Central Processing Unit)와 비교하면 속도 차이가 극명하다. NVIDIA는 그 차이를 영상으로 공개했다. NVIDIA가 단순 GPU 때문에 성장한 것은 아니다. GPU에 CUDA(Compute Unified Device Architecture) 기술이 결합된 결과다. 그 결과 GPU에서 수행하는 알고리즘을 C 프로그래밍 언어에도 사용할 수 있게 됐다. CUDA 도입으로 NVIDIA는 AI가 원하는 대량 연산 처리를 할 수 있게 됐다. AI 소프트웨어에 딱 맞는 하드웨어가 된 것이다. AI 핵심이 딥러닝이 되면서 GPU는 필수가 됐다. 현재 NVIDIA의 전 세계 GPU 점유율은 98%다. AI 산업 수요는 더 커질 전망이다. NVIDIA가 급성장한 이유다. ChatGPT 개발사 오픈 AI의 SORA 서비스로 누구나 명령어 몇 개로 동영상을 만들 수 있다. 기업들도 AI로 만든 영상을 제품 바이럴에 사용하고 있다. 한 기업은 자사 바디워시 제품 바이럴 영상을 AI로 만들어 공개했다. 이제는 불편한 골짜기도 느껴지지 않는다. NVIDIA 창업자 젠슨황 “전 세계 1천 조 규모의 데이터 센터가 있다. 현재 생성형 AI로 전환하는 과정” NVIDIA가 급성장하자, 창업자 젠슨황의 발언도 주목받고 있다. 그는 “전 세계 1천조 규모의 데이터 센터가 있으며 생성형 AI로 전환되고 있다”고 말했다. 그는 2020년 9월에 “몇 년 안에 수조 대의 컴퓨터가 AI를 실행 하면서 새로운 사물 인터넷 시대가 올 것.”이라고 말하기도 했다. AI든 사물 인터넷이든 핵심은 데이터다. AI는 수많은 데이터를 학습하고 처리한다. 사물인터넷은 인터넷을 통해 데이터를 주고받으며 움직인다. 데이터는 SNS, OTT, 유튜브, 블로그, 각종 앱을 사용할 때마다 생성되고 쌓인다. “하루에 5엑사바이트”가 생성된다. 엑사바이트는 10¹⁸에 해당한다. 이는 “정보화 산업이 시작된 시기부터 2003년까지 생산된 모든 정보의 양”이다.1) 1분 동안 벌어지는 디지털 활동을 보면 이 말이 이해가 간다. 2023년에 1분 동안 3억 4,700만 회의 유튜브 영상 조회, 45만 2천 시간의 넷플릭스 영상 스트림, 6억 2,500만 개의 틱톡 동영상 조회, 2,100만 명의 페이스북 유저 활성화, 65,972개의 인스타그램 게시물이 공유됐다. 하루가 아니라 1분이다. 단순 계산으로 유튜브 동영상은 하루에 약 5천억 회 조회된다. 전 세계 스마트폰에서 일어나는 일이다. 한 사람이 초당 만들어 내는 데이터는 1.7mb다. “전화기며 태블릿 PC, 컴퓨터 등에는 분명 감춰진 비용이 존재한다. 이는 계산에 포함되지 않았거나 우리의 감각에서 벗어나는 것이라는 이유로 무시되어 온 빙산의 아랫부분이다. (중략) 디지털 업계는 최근 몇 년 사이 이러한 데이터들끼리의 교류를 가능하게 하기 위해 놀랄만한 인프라를 구축했으니, 그것은 바로 데이터 센터다.”1) “우리가 어떻게 스마트폰을 사용하든, 스마트폰은 데이터센터와 연결되어 있다.”1) 또한, “오늘날 전 세계의 데이터센터는 면적이 500제곱미터에 미치지 못하는 규모가 거의 300만 개가량, 그보다는 큰 중간 규모가 8만 5,000개, 그리고 에퀴닉스 AM4에 버금가는 규모가 수만 개 정도 분포해 있을 것으로 추정된다.”1) 바로 앞 친구 SNS 게시물에 누른 좋아요는 총 7번의 과정을 거쳐 전달된다. 데이터센터를 반드시 거치며, 데이터는 해저 케이블로 전달된다. SNS뿐만 아니라 앞서 1분 동안 이루어진 활동 모두 마찬가지다. 방해금지 모드가 없는 데이터센터 데이터센터의 미덕은 꺼지지 않는 것이다. 데이터센터가 꺼지면 연관 산업은 셧다운 된다. 지난 2022년 10월 SK C&C의 데이터센터 화재가 발생하면서 데이터 처리가 되지 않았다. 이에 따라 카카오톡, 카카오 택시, 카카오 페이 등 카카오 관련 서비스가 모두 먹통이 됐고, 신한카드도 결제되지 않았다. 데이터센터 화재로 데이터 처리가 되지 않으니, 해당 데이터센터를 이용하던 모든 서비스가 중단 된 것이다. SNS, OTT 시청, 온라인 결제, 이메일 전송, 무선 인터넷 등은 24시간 내내 작동해야 한다. 때문에 데이터센터는 멈추면 안 된다. ‘단 1초도 멈추지 않는' 게 데이터센터의 안정성이다. 데이터센터에게 방해금지 모드는 존재하지 않는다. 24시간 켜져있는 디지털은 24시간 내내 기후변화를 가속화 한다 꺼지지 않는 데이터센터와 24시간 접속 가능한 산업을 유지하기 위해 엄청난 전기가 소모된다. “디지털 산업계가 하나의 나라라면, 이 나라는 전기 소비 면에서 미국과 중국의 뒤를 이어 세계 3위를 차지할 것이다. 그런데 오늘날 전기의 35퍼센트가량은 여전히 석탄을 통해서 생산된다. 사정이 이러니, 지구의 전체 온실가스 배출량 가운데 약 4퍼센트는 디지털 산업에서 발생하는 형편이다.”1) 자동차가 차고에 있을 때 이산화탄소를 배출하지 않는 반면, 디지털은 24시간 켜진 상태로 24시간 내내 열을 방출한다. 이 열을 24시간 내내 식혀야 한다. 그렇지 않으면 SK C&C 사태가 재발한다. 열기를 식히는 데는 HFCs 등 불소화가스가 사용된다. 이는 온난화 가스들이다. 온난화 효과는 이산화탄소의 배가 된다. 현재 해당 가스 배출량 계산 지침도 없는 상태이며, 기업의 배출량 파악도 명확치 않다. 아마존, 메타, 넷플릭스, 유튜브 등 주요 디지털 기업은 자사 지속가능경영보고서 혹은 ESG 보고서에 HFCs 가스 배출량을 공개하고 있지 않다. 편리함과 효율성, 속도에 감춰진 환경 비용 계산을 못 하는 것이다. 디지털 산업은 제품 “가격 책정 기능은 뛰어난지 몰라도 비용을 파악하는 능력은 없다"2) 우리가 사용하는 디지털은 24시간 내내 전기를 사용하고, 24시간 내내 열을 내뿜으며, 그 열을 식히는 HFCs 등 불소화가스를 24시간 내내 사용해야 한다. 이 모든 건 대기 중에 이산화탄소를 배출하는 것이다. 24시간 내내 이산화탄소를 배출하는 달리는 자동차인 셈이다. 기업의 잘못만도 아니다. 인터넷 사용자 모두에게도 인터넷을 끊임없이 긴장 상태로 몰아간 책임이 있다. 한 엔지니어가 말했다. "인터넷 사용자들은 웹이 기능하는 방식을 우습게 알죠. 이들은 인터넷이 늘 빨리, 더 빨리 일하기를 기대하는 버릇없는 아이들 같습니다. 그런데 그렇게 하다 보면 결국 모두가 이러한 빨리빨리 논리의 지옥에 떨어져서 빠져나오지 못하게 됩니다."1) 디지털 산업 뒤에 감춰진 논리를 봐야 한다 생성형 AI가 산업에 더욱 쓰이고, 편리함과 효율성, 속도에 취해 더 빨리, 더 많이 논리를 살찌우면 데이터는 점점 더 커진다. 이미 “텍스트 하나를 작성하는 데 필요한 출력은 2~3년마다 두 배로 늘어났”으며 “점점 더 복잡해지는 명령행을 점점 더 많이 소화하느라 컴퓨터들은 쉼 없이 고군분투”1) 하고 있다. 2035년까지 생성될 데이터의 기울기는 매해 가파르게 올라간다. 2035년이 되면, 2,142 제타 바이트의 데이터가 만들어 질 전망이다. 1제타 바이트는 10²¹이다. 젠슨황의 말처럼 모든 데이터센터가 생성형 AI로 전환되면, 더 많은 데이터가 처리되고, 처리된 양만큼 더 많은 데이터가 생성될 것이다. 이는 신규 데이터센터 건립과 더 많은 데이터처리로 이어질 것이다. 더 빠르고, 더 많다는 기준은 항상 이전의 속도와 양이다. 1990년대 말 8초를 견딘 사람들은, 이제 3초도 못 견딘다. 더 빨리, 더 많이를 추구하는 우리는 이미 “빨리빨리 논리의 지옥"에 떨어져 있으며, 이 논리에는 성장 논리가 숨어있다. ‘더 빨리, 더 많이’ 뒤에 ‘생산과 소비’를 넣어도 이상하지 않다. ‘더 빨리 생산, 더 많이 생산' 과 ‘더 빨리 소비, 더 많이 소비'는 성장의 논리다. 작년보다 더 많이 생산되고 소비될 때 성장했다고 말한다. 또한 그 성장을 신화처럼 여기고 건드리지 않으려 한다. 설령 성장하지 못해도 ‘성장' 단어를 절대 놓지 않는다. 코로나19 팬데믹으로 전 세계 경제가 후퇴했을 때, 언론과 정부는 후퇴를 ‘마이너스 성장' 혹은 ‘제로 성장' 이라고 불렀다. 성장을 얼마나 추구하는지 알 수 있는 부분이다. 프란츠 알트는 ‘마이너스 성장과 제로 성장'이라는 단어가 의아하다며 “성장 없이는 아무 일도 안 된다고 생각한다.”3)고 비판한 바 있다. AI 등 디지털의 발전은 우리 사회를 전에 없던 성장의 길로 이끌 것처럼 보인다. 몇 시간이 걸러셔 하던 영상 편집을 명령어 몇 개로 단숨에 끝내버리니, 당연하다. 구글에서 긁고 긁어서 찾은 자료를 ChatGPT가 단숨에 찾아주니, 당연하다. 비단 영상과 자료 리서치만이 아니라, AI가 펀드도 관리하고 있다. 이러한 발전은 우리를 달콤한 편리함과 효율성에 취하게해, AI와 디지털을 더욱 쓰게끔 만든다. 그리고 디지털이 더욱 확대되고 발전해야 한다고 말한다. "성장하면 더 좋은 걸 쓸 수 있어"라고 말한다. 달콤한 속삭임이다. 달콤한 건 언제나 독이다. 그 속삭임 뒤에 있는 환경 비용을 보고, 우리는 반드시 질문해야 한다. 곤란한 질문을 해야 한다 “우리 자식들과 손자들은 우리가 연금을 80마르크나 100마르크 더 받거나 덜 받는 것을 가지고 우리를 평가하지 않을 것이다. 그들은 우리가 그들에게 맑은 물, 건강한 땅, 그리고 깨끗한 공기를 물려주는 것을 가지고 우리를 평가할 것이다.”3) 독일 화폐 마르크는 2002년에 폐지됐다. 프란츠 알트가 말한 자식과 손자는 지금 세대다. 그의 예측은 빗나갔다. 지금 세대는 신규 아이폰, 새로운 넷플릭스와 유튜브 콘텐츠, 릴스, ChatGPT가 만든 효율성에 열광한다. 그레타 툰베리 등 기후세대가 등장했지만, 디지털 네이티브인 “'기후세대'는 2025년에 이르러 디지털 업계의 전력 소비량 (전 세계 전기 생산량의 20퍼센트)과 온실가스 배출량 (전 세계 배출량의 7.5퍼센트)을 두 배 증가시키는 주요 요인으로 지목될 것이다.”1) 성장만의 추구가 멈추지 않는 이상, 모든 환경 캠페인은 현상만 제거할 뿐 원인 제거를 하지 못한다. 디지털 클린 업 데이에 참여해 메일함 비우기에 만족하는 건, “타이타닉호에 고인 물을 티스푼으로 떠내는 것만큼 소용없는 일이다.”2) 물론 필요하다. 무의미하고 의무적인 댓글과 좋아요를 남기는 것 보단, 지우는 편이 더 낫고, 의무적인 댓글과 좋아요는 없는 게 낫다. “제일 중요한 건 얼마만큼의 기가바이트를 절약했느냐가 아니라 행사를 통해서 사고방식이 바뀌는 것"1)이다. 메일함을 비운 뒤, 신규 콘텐츠에 좋아요를 누르고, 댓글을 달고, 공유하는 행위가 반복된다면, 이는 실상 아무 변화도 없는 것이다. 사고가 바뀌고, 성장만을 추구하는 시스템을 바꿔야 한다. “시스템을 바꾼다는 것은 곧 우리를 지배하는 규칙이나 우리에게 영향을 미치는 문화를 바꾼다는 것이다.”4) 이를 위해선 “사실이 신념에 영향을 주게 만들어야 할 뿐 아니라 곤란한 질문을 많이 던져야 한다. 한두 개의 질문만으로는 충분치 않다. 질문이 충분치 않으면 오히려 거짓된 안도감에 빠질 수 있다.”5) 몇 가지 질문으로 도달한 친환경 소비, 친환경 생산, 녹색 성장은 오히려 거짓된 안도감일 뿐이다. 이는 친환경과 녹색이라는 이름 하에 더 많은 소비와 생산을 만들 뿐이다. 그로인해 환경 비용이 더 커진다는 게 사실이다. 오프라인과 동일한 비판, 온라인에 해야 할 '곤란한 질문' AI로 더욱 주목받기 시작한 디지털 산업이 커질수록, 우리 눈에 보이지 않던 비용도 점차 커질 것이다. 그 규모는 비자림로 도로 확장과는 비교도 안 될 정도로 거대하다. 그린피스의 표현을 빌리자면, “십중팔구 인간이라는 종에 의해 건설 된 가장 광대한 것"이다.1) 인류의 진화를 말한 유발하라리는 호모 사피엔스 이후 인류를 호모 데우스라고 말하면서, 현대 세계가 성장을 절대선이자 절대가치로 받아들이고 있으며, 성장에 반하는 걸 이단적인 생각으로 받아들인다고 말한다.6) 그는 이 성장 신화를 멈춰야 한다고 말했다. 그 신화가 환경 문제를 볼러오기 때문이었다. 우리가 원하는 세상에 살기 위해서는 성장이 가져올 유토피아만 바라봐선 안 된다. 함께 따라오는 어쩌면 그 보다 더 거대한 디스토피아를 함께 봐야 한다. 그 시작은 감춰진 비용을 보는 것이다. 우리가 해야할 곤란한 질문이다. 유튜브 영상 조회와 넷플릭스 스트리밍 시간, SNS에 누른 좋아요에는 감춰진 비용이 존재한다. 전 세계의 비트코인 채굴 전기 소비량은 호주 전체와 맞먹는다. 또한, "싸이의 강남스타일 유튜브 조회수 17억 회 당시, 전기 소비량이 297기가와트시"1)였다고 추정된다. 이는 프랑스 도시인 "트루아의 연간 전기 소비량과 같은 양"1)이다. 현재 강남스타일의 유튜브 조회수는 50억 회가 넘었다. 이 보다 더 높은 조회수를 기록한 영상은 2021년 기준으로도 5개가 존재한다. 여기에 곤란한 질문을 해야한다. 유튜브 영상 조회수를 보고, "이 영상으로 얼마를 벌었냐"가 아니라, "이 영상의 조회수로 만들어진 환경 비용은 얼마인지", "이 영상을 계속 보여주기 위해 쓰인 전기는 얼마인지" 등 상대방이 곤란해 할 질문을 해야한다. 곤란한 질문을 할 때 디지털 산업과 성장 논리가 감춰 놓은 비용이 드러나고, 숨길 수 없을 것이다. 질문 할 수 없다면, 최소 높은 조회수에는 높은 환경 비용이 감춰져 있다는 걸 인지해야 한다. 디지털에 남기는 모든 흔적은 환경 비용을 가지고 있다. 이 글도, 이 글에 눌린 좋아요도, 공유도, 이 글이 올라가는 플랫폼 자체도 환경 비용을 만들고 있는 건 틀림 없는 사실이다. 눈에 보이지 않고, 보려고 하지 않을 뿐이다. 이 모든 사실을 알고 비판해야 한다. AI가 더 빠른 속도와 편리함과 효율성을 기반으로 확산될 수록, 환경 비용은 더욱 커질 것이다. 부디 내가 사용하는 디지털 산업이 어느 정도의 환경 비용을 유발하는지 생각하고, 산업과 그 기업에 환경 비용이 얼마인지 물었으면 좋겠다. 또한, 현재 산업을 이끄는 지배적 논리가 무엇인지 알고, 그것에 대한 비판을 가했으면 좋겠다. 은유 작가는 “우리가 의심없이 행했던 일을 의심하는 순간 해방의 바람은 불어오고 있을 것입니다.”7)라고 말했다. 우리가 의심없이 받아들였던 성장과 시스템을 의심하는 순간, 변화의 바람은 불어오고 있을 지도 모른다. 1) ⟪좋아요는 어떻게 지구를 파괴하는가⟫ (기욤 피트롱/ 갈라파고스/ 2023) p.23, 43, 75, 105, 109, 112, 113, 139, 142, 161, 188 2) ⟪비즈니스 생태학⟫ (폴 호켄/ 에코리브르/ 2004) p.23, 122 3) ⟪생태적 경제기적⟫ (프란츠 알트/ 양문/ 2005) p.32, 33 4) ⟪업스트림⟫ (댄히스/ 웅진지식하우스/ 2021) p.140 5) ⟪파도가 칠 때는 서핑을⟫ (이본 쉬나드/ 라이팅하우스/ 2020) p.320 6) ⟪호모데우스⟫ (유발 하라리/ 김영사/ 2021) p.285~304 7) ⟪해방의 밤⟫ (은유/ 창비/ 2024) p.250

2024.04.01

·

·

AI 윤리 레터

90

목소리를 보는 AI

목소리를 보는 AI by. 💂죠셉 농인들의 언어인 ‘수어(sign language)’에 대해 얼마나 알고 계신가요? 저는 2년 전쯤 우연히 올리버 색스의 <목소리를 보았네>라는 책을 만나 수어의 세계에 매료되었고, 한국 수어를 배우기 시작했습니다. 이후 여러 사람과 이야기를 나누다 보니 수어에 대한 일반적인 오해가 몇 가지 있단 걸 알게 됐는데요. 예를 들어: 가령 한국 수어의 경우 청인들이 사용하는 ‘한국어'를 단순히 손으로 옮긴 게 아닙니다. 한국 수어가 공식적으로 대한민국의 제2 법정 공용어라는 사실에서 알 수 있듯, 수어는 그 자체로 하나의 완전한 언어체계이자 문화입니다. 다만 청인들의 음성 언어와는 완전히 다른 ‘공간 언어'인 것이죠. (농인은 수어로 생각하고 꿈도 꿉니다.) 청인이 음성이나 문자 대신 갑자기 손을 사용해 소통해야 한다면 무척 낯설겠죠? 즉, 농인들에게 ‘한국어’는 노력해서 배워야 하는 낯선 개념의 제2외국어라는 것입니다. 전 세계 공용 수어는 존재하지 않습니다. 한국어와 영어가 다른 것처럼 한국 수어와 미국 수어도 완전히 다른 언어입니다. 이름에 손 수(手)자가 들어갔지만, 손의 움직임은 수어 커뮤니케이션의 일부분일 뿐입니다. 가령 똑같은 손 제스쳐를 취해도 얼굴로 어떤 표정을 짓느냐에 따라 수어의 의미는 달라질 수 있습니다. AI 이야기를 하는 레터에서 왠 수어 이야기냐고요? 작년 2월, 신경다양성을 주제로 한 워크샵에서 한국계 수어 아티스트인 크리스틴 선 킴 (Christine Sun Kim)의 발표를 들을 기회가 있었는데요. 발표 이후 질의응답 순서 때 제가 했던 질문이 생각납니다. "농인 커뮤니티는 LLM(거대 언어 모델)을 기반으로 한 AI 기술을 어떻게 활용하고 있나요?" 당시 챗GPT의 등장으로 챗봇들이 막 화제가 되기 시작했던 시점이었기 때문에 구체적인 대답을 듣지는 못했는데요. 각종 거대 언어 모델들이 앞다퉈 상상을 초월하는 성과를 이루는 걸 목격한 지난 1년이었지만, 저의 질문에 대한 대답은 여전히 답보 상태인 것 같습니다. 일단 Deaf community, sign language, AI 등의 키워드로 구글 검색을 해봐도 주류 언론사는 물론 일반 블로그 포함, 흥미로운 글이 몇 없습니다. 그만큼 상대적으로 관심도 적고, 현실적인 어려움도 있다는 뜻일 텐데요. 제가 위에 나열한 수어의 특징들이 난관으로 작용하고 있는 것으로 보입니다. 수어를 비디오로 캡쳐한 후 LLM을 통해 문자 언어로 번역해 내는 과정에 대한 몇몇 연구 결과가 존재하지만, 프로토타입 수준으로 아직 상용화와는 거리가 있어보입니다. 앞서 언급했듯 수어는 청인 입장에서 보면 ‘비언어’에 속하는 많은 요소 (손뿐만 아니라 얼굴 표정, 필요할 경우 바디 랭귀지까지)를 포함하기 때문이죠. 더구나 국가마다 다른 수어가 존재한다는 것은 그만큼 데이터를 확보하기가 어렵다는 뜻이기도 합니다. 웹상의 데이터들을 긁어모아 활용하는 거대 언어 모델의 특성상 영어 외 언어가 상대적으로 소외 될 수밖에 없죠. 언어 중에도 소수에 속하는 전세계 300여 개의 수어는 더욱 그렇습니다. 그런데 기술적 어려움과는 별개로, 챗봇 사용에 대한 농인 커뮤니티 내부의 우려가 존재한다는 점은 주목할 만합니다. LLM을 기반으로 하는 챗봇 사용은 정보에 대한 접근성 측면에서 농인들에게 분명 도움이 되는 측면이 있지만, 문자를 기반으로 하는 기술에 의존할 수록 수어 사용이 줄어들 수 있다는 것이죠. 농인 커뮤니티에게 수어는 단순 소통의 수단을 넘어 그들 고유의 문화와 인권 투쟁의 역사를 포함하는 의미가 있습니다. 전 세계 대부분 농인 커뮤니티가 오랜 기간 사회적응이라는 목적하에 청인의 언어를 강요 받은 역사를 공유하기 때문인데요. 챗봇 사용 및 도입을 ‘생존을 위한 필수 역량’처럼 이야기하고 있는 분위기가 보편화될 수록, 조금 다른 맥락에서 과거 획일화의 역사가 반복되는 건 아닐까요? 구글의 AI 윤리 리서쳐였던 팀닛 게브루의 보고서에 따르면 인터넷상에 흩어져있는 텍스트들을 학습한 거대언어모델은 자연스럽게 특권층의 언어를 대표합니다. 생업이 바쁘다거나 장애 등의 이유로 온라인보다 현실 세계에 더 많이 속해있는 사람들은 그만큼 온라인상에 흔적이 적고, 그 결과로 학습에서 배제되기 때문이죠. 오늘 저의 레터는 농인 커뮤니티를 중심으로 이야기를 전달했지만, 챗GPT와 같은 거대 언어 모델의 다양성 확보라는 측면에서 중요한 의미를 가집니다. 기술 발전의 뒤편에서 소실되는 다양성에 대해 계속 예의주시하며 그에 대한 감각을 유지해야 하는 이유. 그건 우리 모두가 어떤 형태로든 소수성을 가지고 있기 때문일 겁니다. 갈수록 사회 전반에 걸쳐 영향력을 행사하게 될 AI 모델이 어떤 식으로 개발되는지, 그 과정에서 가치판단이 필요할 때 누가 왜 그런 결정을 내렸는지에 대해 우리는 더욱 높은 투명성을 요구할 권리가 있습니다. 스케일이 커진다면 지능이 등장할까? [Part. 1] by 🧙‍♂️텍스 🧙‍♂️ 안녕하세요. AI 윤리 레터에 필진으로 새로 합류한 텍스(Tex) 입니다. 인공지능 연구자로 컴퓨터 비전과 기계학습을 주로 연구하고 있고, 기술과 사회의 상호작용에 많은 관심이 있습니다. 근 10여 년 인공지능 발전을 지켜본 연구자로 요즘 분위기는 참 새삼스럽습니다. 알파고가 이세돌을 이겼을 때도 미디어는 시끄러웠지만 사회에 큰 변화는 없었던 것 같습니다. 하지만 챗GPT와 Stable Diffusion의 등장 이후로 인공지능에 대한 분위기가 크게 바뀐 것이 느껴집니다. 과거 인공지능 커뮤니티는 엄청 개방적인 연구 커뮤니티였습니다. 인터넷상의 인공지능 논문은 원래부터 누구나 접근할 수 있었고 실험을 위한 데이터와 코드 또한 공개된 것들이 많았습니다. 하지만 언제부턴가 인공지능 커뮤니티는 점점 폐쇄적으로 변해가고 있습니다. 학술대회에서 다루는 주제 또한 상업적인 가치가 있는 것들로 편중되는 듯한 느낌을 받습니다. AI 윤리 레터의 공간을 빌어 연구자 혹은 엔지니어의 시선으로 인공지능 분야의 상황에 관해서 이야기해 보려고 합니다. 대규모의 모델, 데이터, 그리고 컴퓨터 자원이 있다면 범용 인공지능에 이를 수 있다는 ‘오픈AI의 스케일에 대한 믿음’은 어느 순간 법칙처럼 미디어에 회자됩니다. 이러한 가설에 기반 해서 많은 이야기가 돌아다닙니다. 인공지능 학계에서 스케일에 대한 믿음이 어떻게 등장했는지 살펴보고 이후 최근 동향에 대해 분석해 보려고 합니다. 글이 길어질 것 같으니 일단 그 ‘믿음’이 생긴 과정을 서술하고 이후 관련 이야기들에 대한 생각을 정리하겠습니다. 이미 실패했던 스케일 업 (Scale up) 대규모 인공신경망 모델이 등장하기에 앞서 태초에 대규모 데이터가 있었습니다. 스탠포드의 페이페이 리 교수는 2009년 이미지넷 데이터셋을 완성합니다. 그리고 2010년부터 이미지넷 챌린지를 시작했습니다. 이미지넷 챌린지는 총 1,281,167개의 학습 이미지 이용해서 1,000개의 물체 범주를 예측하는 물체 인식 알고리즘을 만드는 대회였습니다. 2011년까지는 기존 연구자들은 인간의 눈에서 영감을 얻은 알고리즘을 고도화시켜 가며 물체 인식을 진행하고 있었습니다. 2012년 혜성처럼 등장한 AlexNet은 기존 기법을 사용한 2등과의 압도적인 차이로 1등을 달성했습니다. AlexNet은 당시 기준으론 굉장히 거대한 모델이었습니다. 신경망의 매개변수(parameters) 개수만 해도 6,230만 개 (62.3M)였고, 파일 크기로 환산하면 237.7 MB에 이르렀습니다. AlexNet 연구진은 CPU 대비 훨씬 빠른 행렬 연산 속도를 자랑했던 엔비디아 GPU 2개를 사용해 AlexNet 학습을 진행했습니다. AlexNet이 엔비디아 GPU에서 학습되었다는 사실이 엔비디아의 현 모습을 절반 정도는 설명합니다. (나머지 절반은 아마 암호화폐가 설명하지 않을까 싶습니다.) 2012년 AlexNet이 이미지넷 챌린지 1위를 한 이후 인공신경망은 ‘딥러닝’이라는 이름으로 부활합니다. AlexNet은 7개의 인공신경망 레이어로 이루어져 있었습니다. 이후 등장한 연구들은 레이어를 더욱 깊게 쌓아가며 높은 성능을 달성하였고, ‘사람보다 나은’ 성능을 달성하기에 이릅니다. 사람을 넘었다는 점에서 적어도 물체 인식 알고리즘은 ‘약한 인공지능’을 이루었다고 할 수 있습니다. 하지만 여기서 더 나아가 1,202개의 레이어까지 쌓아본 연구는 더 많은 레이어가 언제나 좋은 성능을 이끄는 것은 아니라고 결론지었습니다. 이후 ‘딥’하게 레이어를 쌓는 연구는 주춤하게 되었고, 그 대신 인공신경망 구조를 탐색하고 다른 학습 기법을 연구하는 쪽으로 관심이 옮겨가게 됩니다. 어찌 보면 이미 모델의 스케일업은 한번 실패했었습니다. 약한 인공지능을 모으면 범용 인공지능이 될 수 있을까? 2014~2016년에 이르러 딥러닝 알고리즘은 기존에 풀지 못하던 많은 문제를 해결해 나가기 시작합니다. 구글 번역에 탑재된 기계번역 알고리즘의 성능이 눈에 띄게 좋아졌고, 물체 인식의 성능은 사람의 성능을 넘게 되었으며, 2016년에서는 알파고가 이세돌을 이기는 예상치 못한 이변이 일어났습니다. 하지만 이러한 성취는 특정 작업만 수행하는 ‘약한 인공지능’으로 여겨졌습니다. 이후 생각의 확장은 자연스럽습니다. 여러 작업을 동시에 잘 푸는 알고리즘을 만들면 그것이 ‘강한’ 인공지능이 되는 것이 아닌가란 생각이죠. 학계에서는 이를 다중 작업 학습 (multi-task learning) 이라 불렀습니다. 이 패러다임의 가장 유명한 사례 두 가지가 있습니다. 하나는 테슬라의 오토파일럿이고 또 하나는 오픈AI의 GPT입니다. 초기의 오토파일럿은 자율주행을 위한 여러 인식 문제를 하나의 인공신경망으로 풀었습니다. 과거 테슬라 오토파일럿을 이끌었던 안드레 카파시 (페이페이 리 교수의 제자이기도 합니다) 는 오토파일럿에서 사용하는 다중 작업이 어떠한 것들이 있는지 발표한 적이 있습니다. 그 발표 자료에 나와 있듯, 자율주행을 위한 작업의 종류는 사전에 정의가 되어 있습니다. 한편 오픈AI의 GPT는 테슬라의 오토파일럿과는 다른 방식을 택했습니다. GPT는 ‘언어로 문제를 설명하는 것이 작업’이라는 관점으로 언어 모델에 집중했습니다. 이렇게 하면 임의의 언어로 작업을 새롭게 정의할 수 있다는 장점이 있기 때문이죠. 우리가 요즘 챗GPT에게 입력하는 프롬프트가 바로 이러한 임의의 언어로 정의된 작업의 한 예입니다. 이를 통해 인터넷의 수많은 텍스트 데이터를 모두 학습 데이터로 사용할 수 있는 가능성이 열렸습니다. 오픈AI는 GPT를 구성하는 인공신경망의 크기와 데이터 규모를 조금씩 키워나갔습니다. 인공신경망의 크기를 살펴보면, GPT1(117M)은 446MB, GPT2(1.5B)는 5.6GB 그리고 대망의 GPT3(175B)는 651.9GB(!)에 이르렀습니다. 위 그래프를 보면 왜 오픈AI가 스케일을 키우고 싶어 하는지를 알 수 있습니다. 175B보다 더 큰 모델을 학습시키면 파란색 선을 상회하는 성능에 이르지 않겠느냐는 기대였겠죠. 그런데 그다음으로 나온 것은 더 큰 텍스트 모델이 아니라 텍스트와 이미지를 동시에 다룰 수 있는 멀티모달 (multi-modal) 형태의 GPT4였습니다. 모델 스케일을 더욱더 키우기 위해서는 그에 앞서 데이터의 스케일을 키워줘야 합니다. AlexNet 등장 이전에 대규모 데이터셋인 이미지넷이 존재했던 것과 같은 맥락입니다. 그런데 만약 GPT3를 위해 인터넷에 공개된 모든 텍스트를 이미 사용했다면, 데이터셋을 더 키우기 위해 남은 선택지는 ‘다른 형태의 데이터’를 추가하는 것밖에 없습니다. 인공지능이 다루는 멀티모달 데이터의 종류는 앞으로도 계속 범위를 확장해 나갈 가능성이 큽니다. 데이터 스케일을 키우기 위한 가장 쉬운 해법이기 때문이죠. GPT4 기술보고서에는 모델 크기와 데이터 규모, 컴퓨팅 자원 중 어느 것도 공개되지 않았기에 스케일이 얼마나 커졌는지 알 수가 없습니다. 하지만 더 많은 자본이 투입되었다는 것을 확인해 볼 수 있는 단서는 있습니다. 바로 저자 숫자입니다. 2018년 GPT1은 4명, 2019년 GPT2는 6명인데 2020년 GPT3 논문의 저자 숫자는 31명으로 급격히 늘었습니다. 그리고 대망의 GPT4 테크니컬 리포트에서는 거의 전사 직원이 아닐까 싶은 280명(!)이 됩니다. 자본을 대규모로 투자해 이룬 GPT4는 과거의 인공지능 연구와 비교한다면 보다 범용 인공지능에 가까워졌다는 표현을 조심스럽게 할 수 있습니다. 하지만, 챗GPT 서비스에서 보이는 GPT의 모습은 여전히 불완전합니다. 조만간 해결된다는 환각은 여전히 해결되지 않았습니다. 과연 우리는 스케일업을 통해 범용 인공지능을 구현할 수 있을까요? 오늘 이야기 어떠셨나요? 여러분의 유머와 용기, 따뜻함이 담긴 생각을 자유롭게 남겨주세요. 남겨주신 의견은 추려내어 다음 AI 윤리 레터에서 함께 나눕니다.

2024.03.29

·

·