
•
여러 각도 사진 찍은 콜라주 만들기 요즘 AI 공부를 하면서, Prompt Engineering도 같이 좀 보면서 놀고 있는데 사진을 다양한 각도로 보이게 좀 할 일이 있어서 테스트해봤다. 내 얼굴로 한 것은 좀 올리기 그래서, 나의 가상 친구 Lisa 으로 테스트한 결과. 순서대로 ChatGPT, Grok, Gemini의 결과이다. 어느 것이 더 자연스러운가? 본인 사진 가지고 해…

•
구글이 Gemini 2.5 Flash Native Audio 모델을 새롭게 공개하면서, 이를 기반으로 한 구글 앱들도 함께 업그레이드되었다는 소식이 전해졌다. https://blog.google/products/gemini/gemini-audio-model-updates 기존의 음성 기반 AI 대화 방식은 다단계 처리 구조였다. 즉, 사용자의 음성을 먼저 텍스트로 변환하고, 텍스트 상태에서 사고한 뒤, 다시 음성으로 변환하여 들려주는 방식이었다. 하지만 Native Audio 모델이 적용되면서 이 구조가 완전히 바뀌었다. 이제는 음성을…