본문 바로가기

AI 트렌드15

AI 음성 비서를 만들 수 있는 OpenAI Realtime API 안녕하세요! 요즘 AI 기술이 정말 빠르게 발전하고 있죠? 특히 사람과 자연스럽게 소통할 수 있는 대화형 솔루션들이 많이 나오고 있는데요, 그중에서도 OpenAI의 Realtime API는 정말 주목할 만한 기술입니다. 이 API는 다양한 대화형 AI 경험을 빠르고 다채롭게 제공하기 위해 개발되었어요. 오늘은 Realtime API가 무엇인지, 그리고 어떤 혁신적인 가능성을 가지고 있는지 쉽게 설명해드릴게요!저지연 음성-음성 통신Realtime API의 가장 큰 특징 중 하나는 바로 저지연 음성-음성 통신입니다. 음성과 텍스트 사이에 번거로운 중재 과정이 없기 때문에 정말 빠르고 직관적인 대화를 할 수 있어요. 예를 들어, 사용자가 질문을 하면 음성 비서는 거의 즉각적으로 대답을 해줘서 마치 진짜 사람과.. 2024. 10. 4.
GPT with Canvas 부터 NotebookLM 팟캐스트까지: 일상에서의 AI 혁신 최근 AI 기술의 발전 속도는 정말 놀라울 정도로 빠릅니다! 특히 지난 일주일 사이에 일어난 변화들을 보고 있자면, 정말 감탄할 수밖에 없네요. 오늘은 그중에서도 주목할 만한 Whisper-Turbo, GPT with Canvas, 그리고 NotebookLM의 팟캐스트 커스터마이징 기능에 대해 이야기를 나눠보려고 해요. 이 기술들이 우리의 일상과 업무를 어떻게 변화시킬 수 있는지 함께 알아봐요!GPT with Canvas: 상호작용적 글쓰기의 혁신GPT with Canvas는 사용자가 AI와 협력하여 글을 작성할 수 있도록 도와주는 혁신적인 도구입니다. 생성적 AI와 LLM(대규모 언어 모델) 기술을 기반으로, 실시간으로 내용을 수정하고 아이디어를 확장하거나 구조화하는 데 도움을 줍니다. 사용자는 글의 .. 2024. 10. 4.
AI 인터랙션의 진화 과정 5단계로 살펴보기 ChatGPT부터 Figure 01까지 루드비히 브트겐슈타인의 "내 언어의 한계는 내 세계의 한계를 의미한다."라는 말은 언어가 우리의 인식과 경험을 형성한다는 깊은 통찰을 담고 있습니다. 그리고 LLM을 이용해 언어로 세상을 이해하는 AI를 만들고 있는 Open AI의 시도와도 같은 측면이 있네요. 이제 AI는 정말로 마치 "이해"하고 있는 것처럼 세상과 상호작용하고 있습니다. OpenAI가 chatGPT를 공개한 지 1년과 약간의 시간이 지난 지금까지 AI가 세상과 상호작용하는 방식에는 많은 진화가 있었어요. 대화형 챗봇에서 시작하여 API를 이용한 plug-in 기능, 멀티모달 능력, 최근에는 figure 01을 통한 물리적 상호작용까지 선보이며 사용자가 AI와 상호작용을 통해 얻을 수 있는 경험의.. 2024. 3. 21.
[Open AI] 비디오 생성 AI Sora의 놀라운 3가지 특징 Open AI가 공개한 충격적인 비디오 생성 인공지능Sora로 만든 동영상 이 영상은 Open AI의 Sora로 만든 영상으로, 한 여자가 도쿄의 거리를 걷고 있는 장면을 묘사한 Prompt만 입력하면 이렇게 생생한 비디오를 생성할 수 있다고 하네요. 지금까지의 비디오 생성 AI와는 차원이 다른 퀄리티로 많은 사람들을 충격에 빠뜨렸는데요, 가장 인상 깊은 특징 3가지를 통해 Sora에 대해 알아보도록 하겠습니다. 일관성 유지우선, 가장 큰 특징은 일관성 유지에요. 아래 세 사진은 Sora의 영상에서 캡처한 사진으로 여성이 간판을 지나가는 모습을 볼 수 있습니다. 간판의 글씨가 여성에 의해 가려지지만, 인물이 지나가고 난 후 다시 등장한 간판의 글씨가 그대로 유지되고 있어요. 이는 Sora가 간판과 여성 .. 2024. 2. 18.
728x90