2021년 11월, 대기자로 줄을 설 필요 없이 GPT-3를 사용할 수 있게 되었다. 인터넷에 접속할 수 있으면 누구나 거대언어모델(Large Language Model, 이하 LLM)에 접근이 가능해진 것이다. 공개 초부터 발 빠르게 LLM이 가진 기능과 특성을 학습하고 새로운 가능성을 이야기하고 토론하는 사람이 늘어났다. 2021년 12월, 어느 기술 블로그는 GPT-3의 공개와 함께 2022년은 LLM이 교육과 학교에 큰 영향을 끼칠 것으로 예측했다.1) 하지만 기술을 미리 접하고 흥분한 사람들의 기대와는 달리 생각만큼 GPT-3에 관심을 두는 (AI 분야를 제외한) 전문가를 포함한 일반 대중은 늘지 않았다. 흥미롭게도 대중에게 널리 퍼진다는 느낌이 체감되는 시점은 1년 정도가 더 지난 후 채팅 인터페이스를 입은 ChatGPT2)의 등장부터였다. 누구보다 대중의 관심에 민감한 유튜브 크리에이터들이 ChatGPT에 대해 콘텐츠를 쏟아냈고, 일시적인 유행을 넘어 여러 분야에서 사람의 반응은 폭발적이었다. "인터넷 공간이 만들어진 20년 동안 우리는 소비자 인터넷 앱에서 이보다 빠른 성장곡선을 기억할 수 없다."라고 UBS는 보고했다.
새로운 생각이나 기술이 확산될 때는 나름의 과정을 거치고, 다수자에게 전파되기까지 시간이 걸린다. GPT-3 공개 이후 1년 정도의 시간이 필요한 게 당연하게 보이기도 하지만 더 작은 언어모델을 가진 ChatGPT가 공개된 직후의 전파속도와 사람들의 반응을 볼 때 채팅 인터페이스가 가진 강력함을 무시할 수 없다. 앞서 공개된 GPT-3의 플레이그라운드(Playground) 인터페이스는 기본 메모장처럼 간단하고 비어있는 텍스트 편집기의 모습이다. 편집 화면 안에서 언어의 입력, 실행, 그리고 결과에 대한 출력이 동시에 이뤄지는 환경인데, 컴퓨터 개발자에게는 익숙한 REPL4)처럼 보이기도 하지만 이 또한 대중적이진 않아도 컴퓨터 역사에서 오래전부터 실험되었던 인터페이스5)이다. 간단하지만 높은 자유도의 강력한 인터페이스를 채택한 GPT-3의 플레이그라운드는 오히려 그 공허한 여백 때문에 다수가 접근하는 데 걸림돌이 되었는지도 모른다. 그에 비하면 채팅은 모두에게 익숙하고 직관적이다. 일상화된 상호작용 방식으로 나온 결과물은 LLM이 생성한 텍스트를 대하는 우리의 태도를 크게 바꿨다. 의인화하기 쉽고 감정이입도 잘 된다. 구글이 대화 업무에 최적화된 자사의 LLM인 람다(LaMDA)를 내부 테스트하던 당시, AI에 대한 리터러시가 있는 전문가조차도 람다가 의식이 있다고 믿게 만든 사건6)은 결코 우연이 아닐 것이다.
우리는 LLM이 생성해내는 결과물과 함께, LLM이 탑재될 다양한 쓰기 도구에도 관심을 기울여야 한다. 성격이 같은 언어모델을 사용하더라도 우리가 언어로 상호작용하는 도구 혹은 인터페이스가 달라졌을 때 사용자의 입장에서는 완전히 다른 경험을 하거나 의도하지 않은 영향을 받을 수 있다. 쓰기 도구의 기능적 사용법뿐만이 아니라 도구가 가진 속성에 대한 이해가 필요한 이유다. 역사적으로 인류를 거쳐 간 다양한 쓰기의 도구들은 실은 우리가 생각하는 방식에 여러 영향을 끼쳤다. 철학자 니체가 타자기를 사용하면서 그의 글에 변화가 생겼다는 일화도 그중 한 예이다.
니체의 친구 중 한 명인 작곡가는 그의 작품 스타일의 변화를 알아차렸다. 그의 이미 간결한 글은 훨씬 더 촘촘해지고, 더 전신적(telegraphic)으로 되어 있었다. 그 친구는 편지에서 "아마도 이 도구를 통해 새로운 언어(idiom)를 갖게 된 것"이라며 자기 작품에서도 음악과 언어에 대한 그의 "생각"은 종종 펜과 종이의 질에 달려있다고 언급했다. 니체는 "자네 말이 맞네."라며, "우리의 글쓰기 장비는 우리의 생각을 형성하는 데 영향을 주고 있지."라고 말했다.7)
우리가 인지적 도구이자 인터페이스로 내재화한 언어가 생각을 구체화하고 전달하기 위한 인터페이스로 다양한 쓰기의 도구를 탄생시켰다면, 언어는 메타-인터페이스라고 볼 수 있다. 오늘날의 쓰기 도구는 펜, 종이와 같은 촉감적 하드웨어보다는 디지털 스크린에서 작업의 맥락에 따라 다양한 모습으로 존재하는 소프트웨어가 주를 이룬다. 메타-인터페이스인 언어는 메타-미디어인 컴퓨터 환경 속에서 더 다양한 소프트웨어, 즉 동적인 쓰기의 도구를 계속해서 탄생시킬 수 있게 되었고, 각 쓰기 도구가 가진 다양한 속성은 우리의 사고에 여러 방면으로 영향을 끼치고 있다. 그리고 언어로 매개된 도구라면 어디든 달라붙을 LLM은 이런 쓰기 도구의 속성을 더욱 강화할 것이다.
쓰기 도구를 속성으로 파악하는 방식이 익숙하지 않으면 한 가지 사고 실험을 해볼 수 있다. 우리에게 가장 대표적인 컴퓨터 활용 능력의 척도인 워드, 슬라이드, 시트8)를 생각해보자. 언어로 표현하는 수많은 일상의 작업에서 이 세 개의 도구는 큰 역할을 했다. 그동안 이 도구를 특정 작업을 위한 소프트웨어(문서 작성을 위한 워드, 발표를 위한 슬라이드, 수치계산을 위한 시트)로 기능적 측면만 봤다면, 속성을 생각해볼 수 있는 질문을 던져보겠다.
"이 도구의 속성을 적극 활용해 소설이나 시를 써 보면 어떻게 될까?"
워드로 소설이나 시를 쓰는 건 자연스럽다.9) 하지만 슬라이드의 분절된 페이지, 시각성이 강조되는 텍스트, 그리고 시트의 행과 열, 셀, 셀 안의 함수와 같은 속성을 활용한다면 우리의 글쓰기는 어떻게 영향을 받을까? 어떤 새로운 글쓰기가 가능해질까? 그리고 여기에 LLM이 달라붙어 각 도구의 속성이 강화된다면 무슨 일이 벌어질까?10) 아래는 그 예시다.
1945년 버니바 부시는 "우리가 생각하는 대로11)"라는 글에서 메멕스(Memex)라는 가상의 기계 장치를 상상했다. 이 장치를 통해 작가는 직접 쓸 필요가 없고, 단순 반복적 사고는 논리 법칙에 따라 기계가 대신할 수 있고, 수많은 기록물 안에서 기계가 파일을 검토하고 관련 항목을 선택할 수 있으며, 결과적으로 인간 두뇌의 역할을 메멕스가 기계적으로 해낼 것이라 적었다. 그의 상상 속에서 거추장스러운 물리적 장치로 묘사된 인간-정보처리장치 인터페이스는 이제 언어로 매개된 모든 도구에 임베딩될 LLM으로 현실이 되었다. 이 혁신의 순간은 인류 역사의 그 어떤 쓰기 도구보다도 빠른 속도로 전파되어 우리의 일상이 되고, 생각을 형성하는 데 영향을 끼칠 것이다. 아직 우리가 겪어보지 못한 일이기에 이 순간에 대해 어떤 판단을 내릴지 어렵다. 다만 이 거대한 파도 같은 흐름을 서핑하듯 느낄 수 있는, 그래서 그 속성을 이해할 수 있는 인간으로 남아있길 바란다. [1] https://bakztfuture.substack.com/p/my-biggest-2022-prediction-gpt-3 My Biggest 2022 Prediction: GPT-3 will take over schools and college campuses, 2021-12-27 [2] https://chat.openai.com/ , 2022-11-30 [3] https://www.businessinsider.com/chatgpt-may-be-fastest-growing-app-in-history-ubs-study-2023-2 , ChatGPT는 공개 두 달 만에 1억 MAUs(Monthly Active Users, 한 달 순 이용자수)에 도달했고, 이는 틱톡 서비스도 9개월이 걸린 일이다. [4] Read-Eval-Print Loop, 운영체제의 명령어 터미널이나 파이썬(Python) 언어의 인터프리터는 채팅처럼 코드를 입력하고, 실행하고, 결과를 출력하는 상호작용이 가능한데 이를 REPL이라 부른다. [5] 순수한 객체지향 언어이자 동적인 컴퓨팅 환경인 Smalltalk는 Workspace라는 도구를 통해 이런 환경을 제공했다. 메모장처럼 간단하지만 텍스트 기반 코딩과 실행, 그리고 그 결과에 대한 검사(inspect)가 동시에 이뤄지고, 실행되고있는 컴퓨팅 객체들을 동적으로 다루는 강력한 인터페이스였다. [6] 르모인 사건으로 알려졌으며 당시 채팅 기록을 자신의 블로그에 실었다. https://cajundiscordian.medium.com/is-lamda-sentient-an-interview-ea64d916d917 Is LaMDA Sentient? - An Interview, Blake Lemoine, 2022-06-11 [7] https://www.theatlantic.com/magazine/archive/2008/07/is-google-making-us-stupid/306868/ - Is Google Making Us Stupid?, Nicholas Carr, 이를 두고 독일의 미디어 학자 프리드리히 키틀러는 (타자기라는) 기계의 영향 아래 니체의 문체는 "논쟁적에서 격언(aphorisms)으로, 사색적에서 말장난(puns)으로, 수사적에서 전보 스타일(telegram style)로" 바뀌었다고 평했다. [8] 제품마다 부르는 명칭은 다르지만 워드(Word processor), 슬라이드(Slide), 시트(Sheet)는 대부분의 오피스웨어에서 공통적으로 제공하는 쓰기의 도구이다. 각 도구에서 우리가 어떤 유형의 생각과 경험을 했는지 떠올려봐도 쓰기의 도구가 우리의 생각에 끼치는 영향을 느껴볼 수 있다. [9] 지금은 익숙하고 평범한 워드 프로세서도 컴퓨터 스크린을 통해 처음 등장했을 때 이 쓰기 도구가 가진 여러 생소한 속성(삭제, 수정, 편집 등)으로 인해 사람들의 쓰기 방식과 생각에 큰 영향을 끼쳤다. [10] 이 질문에 관해 생각해보고자 구글 도구(문서, 프레젠테이션, 스프레드시트)에 앱스크립트를 이용해 GPT-3를 연결하는 작업을 했고 워크숍(문장 채굴자, 2022, 김승범 /남현지 /언메이크랩, 경기문화재단)과 발표(LMWS팀의 기계비평)를 통해 실험을 진행했다. 아직은 구체적인 결론을 내기 어렵지만 특정 기업이나 서비스가 제공하는 AI 기능이 아닌 메타-인터페이스로써 LLM의 쓰기 도구를 각자가 재발명하고 탐색하는 일은 중요하다고 생각한다. [11] https://www.theatlantic.com/magazine/archive/1945/07/as-we-may-think/303881/ , As We May Think, Vannevar Bush, The Atlantic, 1945
*웹진 한국연구 2023년 1분기 기획논단은 인공지능을 주제로, LMWS(최승준, 권보연, 후니다킴, 김승범, 오영진)팀의 5개 원고가 게재될 예정입니다.
Comments