OpenAI5 GPT-4O 뒤에 있는 잠재적인 음성 기술 GPT-4O의 주목할 만한 기술 중 하나는 음성 상호 작용 기능입니다. 구글도 Project Astra 결과를 발표했습니다. Project Astra에서도 음성 상호 작용 기술을 개발했습니다. 이는 현재 음성 상호 작용 기술이 모든 대기업에서 매우 중요하게 여기는 분야임을 의미합니다. GPT-4O의 음성 모드인 Voice Mode는 무엇이 특별한가요?풍부한 음성 스타일예: "좀 더 빠르게", "조용하게", "노래하듯이"음성 내용 외의 정보 이해 (상황 파악)예: 숨소리비언어적 소리 발산예: 웃음소리 (GPT-4o는 많이 웃는 모델임)자연스럽고 즉각적인 상호작용 첫째, 다양한 음성 스타일을 제공합니다. 음성 합성을 생각할 때 대부분의 사람들이 떠올리는 것은 siri입니다. siri는 특정한 어조입니다. 하.. 2024. 5. 25. GPT-4o 출시 후 생각해볼 몇 가지 포인트 OpenAI(오픈AI)가 오늘 새로운 멀티모달 대형 모델인 GPT-4o를 발표했습니다. 이 모델은 텍스트, 오디오, 비디오 데이터를 실시간으로 추론할 수 있어 사람과 기계 간의 상호작용을 더 자연스럽게 만드는 중요한 한 걸음을 내디뎠습니다. 초기의 흥분이 가라앉은 후, 몇 가지 생각해볼 포인트를 공유하고자 합니다. 주목할 만한 포인트상호작용 패러다임의 혁신: GPT-4o는 LLM(대형 언어 모델)을 기반으로 더 자연스럽고 친근한 사람, 기계, 물리 세계 간의 상호작용 패러다임을 구축했습니다. 이는 텍스트, 오디오, 이미지 등 다양한 모달을 통합하여 물리 세계를 사람과 기계의 상호작용에 더 쉽게 끼워 넣을 수 있도록 하며, 풍부한 컨텍스트 정보를 제공합니다. 특히, 향후 출력 단에서 물리 세계와의 통합이 .. 2024. 5. 19. OpenAI의 내부 분열: llya Sutskever의 사임과 그 배경 최근 AI 업계에서 큰 파장을 일으킨 사건이 있었습니다. 바로 OpenAI의 수석 과학자인 Ilya Sutskever(일리야 서츠케버)의 사임 소식입니다. 이번 블로그에서는 이 사건의 전말과 그 배경, 그리고 OpenAI 내부의 갈등에 대해 투자자 분들께 상세히 공유드리고자 합니다.사건의 전말2023년 7월: OpenAI는 "Super Alignment Team(슈퍼 얼라인먼트 팀)"의 설립을 발표했습니다. 이 팀은 Ilya Sutskever와 Jan Leike(얀 라이케)가 공동으로 이끌며, 인간보다 더 지능적인 AI 시스템을 어떻게 통제할 것인지 연구하는 것을 목표로 했습니다. 회사는 이를 위해 전체 계산 자원의 20%를 투입했습니다.2023년 11월: 이사회는 CEO Sam Altman(샘 알트만).. 2024. 5. 19. Open AI의 새로운 발표: GPT4O와 시장에 미칠 영향 분석 최근 Open AI(오픈AI)는 그들의 최신 모델인 GPT4O의 출시를 발표하며 기술 업계에 큰 화제를 불러일으켰습니다. 이 모델은 기존의 CHATGPT(챗지피티)에 새로운 사용자 인터페이스(UI), 데스크탑 버전, 그리고 가장 중요한 멀티모달 기능을 추가했습니다. 특히, GPT4O는 음성, 시각, 텍스트를 이해하고 이를 통합해 처리할 수 있는 능력을 갖추었으며, 이는 진정한 의미의 멀티모달 인터랙션을 가능하게 합니다. 이번 발표에서 눈에 띄는 점은 GPT4O가 모든 사용자에게 무료로 제공된다는 점입니다. 비록 우선적으로 체험할 수 있는 기회는 유료 사용자와 기업 사용자에 한정되어 있지만, 이는 Open AI의 기술 접근성을 한층 더 확대하는 조치로 볼 수 있습니다. 흥미롭게도, Open AI는 이번에.. 2024. 5. 15. 이전 1 2 다음