우리는 한다, 개발을.

놓칠 수 없는 AI 최신 기술

⌛ 3 mins

윌 스미스 밈

윌 스미스 ai 영상을 보신적 있으신가요? 약 2년전에 레딧에 올라온 영상입니다.

이때만 해도 ai는 메타버스와 비슷한 현실과 거리가 먼 기술이였던거 같은데요.

현재 ai 기술은 얼마나 발전했을까요? 요즘 난리난 최신 기술 지금 바로 소개합니다!

(다들 알고 계시는 chatGPT는 제외했습니다)

Gemini

구글에서 chatGPT를 대항할 멀티 모달 기반 AI입니다.

이전엔 Bard라고 불리던 ai 를 업그레이드하여 Gemini로 출시했습니다.

갤럭시24에 온디바이스 AI 로 들어간 AI가 바로 Gemini입니다.

  • 멀티모달(Multimodal)은 텍스트, 이미지, 음성, 영상 등을 함께 활용하여 정보를 처리하고 분석하는 인공지능(AI) 기술입니다.

구글블로그에 따르면 아래와 같이 chatGPT보다 뛰어난 성능을 가지고 있다고 소개하고 있습니다.

벤치마크 표

제미나이를 출시한지 약 한달만에 또 gemini-pro 1.5를 공개했는데요

기존 제미나이의 3만 2천 토큰을 넘어 제미나이 1.5 프로는 최대 100만 토큰까지 처리할 수 있다고 합니다.

  • 토큰은 한 단어를 의미합니다. 한마디로 한번에 100만개의 단어를 이해할 수 있다는 뜻입니다.

벤치마크 표

영상 함께 보시죠

영상에서 흑백영상과 함께 사람의 주머니에서 종이 한장을 꺼내는 시간과 종이에 정보들을 알려달라고 요청하니

시간과 종이에 어떤 내용이 있었는지 정확하게 알려줍니다.

또 대충 그린 이미지와 함께 사건이 발생한 시간을 알려달라고 하니까 정확하게 답변합니다.

체험하기

루미에르

구글 리서치에서 공개한 비디오 생성 AI로 텍스트, 이미지를 입력하면 동영상을 생성해주는 모델입니다.

멈춰있는 이미지, 특정 부분이 가려진 영상 등을 아래와 같이 AI가 이미지를 추론하여 영상을 만들어 줍니다.

(처음 봤을때 입이 쩍 벌어졌어요)

비디오 인페인팅

비디오 스타일화

시네마 그래프

르미에르 https://lumiere-video.github.io/

하지만 공개하고 얼마 지나지 않아 openAI에서도 sora라는 비디오 생성 AI를 공개했습니다.

openAI sora

sora 역시 텍스트, 이미지를 동영상으로 만들어주는 모델인데 성능이 미쳤습니다. 직접 사이트를 접속하여 보는것을 추천드립니다.

sora https://openai.com/sora

(구글 주주로써 눈물이 나네요….)

프롬프트 질문 팁

잼민이에게 프롬프트 작성 팁을 알려달라고 해봤습니다.

prompt-tip

망할 제미나이 제대로 답을 안하네요

아무튼 ai 유료 구독을 하라는것 같네요.

설명 예시
역할 부여 AI에게 특정 역할을 부여하면 더 전문적으로 답변해 줄 수 있습니다 ‘너는 천문학 전문가야’
구체적 지시 원하는 결과를 구체적으로 할수록 정확한 답변을 줄 수 있습니다 ‘가장 큰 행성을 알려줘’ X
‘태양계에서 부피가 가장 큰 행성을 알려줘’ O
예시 제시 어떤 형태의 예시를 제시하면 결과를 예시에 맞게 받을 수 있습니다 ‘보내주는 표처럼 태양계 특징을 표 형태로 알려줘’

마치며

모두 관심이 있으셨겠지만 요즘 공개되는 AI 기술들이 너무 대단해서 소개해 드리고 싶었습니다.

일단 저는 메타버스 붐 같은것 들과는 다르다고 생각합니다. AI는 스마트폰이 나왔을때 처럼, 인터넷이 나왔을때 처럼 실체가 있는 기술 도약인 것 같습니다.

대처를 어떻게 해야할지 모를 정도로 하루가 멀다하고 매일 엄청난 기술이 계속 공개되고 있는데요

정말 ai가 미래에 일자리를 다 장악 하는 날이 올 것만 같아 무섭습니다. (마치 아이로봇)

최근 엔비디아 ceo 젠슨황은 ‘프로그래밍을 할 필요가 없도록 하는 것이 우리의 일입니다. 생명공학을 배우세요’ 라고 발언하여 화재인데요

개발자들의 미래는 어떻게 될지 정말 궁굼하네요

AI로 인해 정말 편하게 개발을 하게 될지 vs 아이디어만 주면 AI가 다 만들어 개발자가 필요 없는 세상이 올지

지금으로써는 AI 트랜드를 빨리 이해하고 AI를 최대한 잘 활용하여 빠르게 문제를 해결하는것이 최선이겠죠?….

출처

sora - https://openai.com/sora

르미에르 - https://lumiere-video.github.io/

구글 블로그 - https://blog.google/intl/ko-kr/products/explore-get-answers/google-gemini-next-generation-model-february-2024-kr/