마이크로소프트는 VISA-1이라는
사진 한장과 음성샘플만 있으면
말하는 영상을 만드는 AI를 발표했는데
현재는 연구팀만 사용 가능하다고 하지만
노래 부르는 것도 가능하고
모나리자같은 그림에도 적용됨
이 모델은 512x512 픽셀이미지를 초당 45프레임으로 만드는 작업에
데스크탑의 엔비디아 RTX 4090 GPU로
2분이 소요되고
온라인(실시간)은 40fps가 생성 가능하다고 함
[11]
컬럼버스 | 17:31 | 조회 2264 |보배드림
[9]
홀란드 | 18:08 | 조회 600 |SLR클럽
[12]
대tothe박 | 18:09 | 조회 621 |SLR클럽
[50]
| 18:25 | 조회 0 |핫게kr
[74]
| 18:25 | 조회 0 |핫게kr
[57]
| 18:25 | 조회 0 |핫게kr
[31]
뉘집개가왈왈거리냐 | 18:20 | 조회 0 |핫게kr
[59]
| 18:15 | 조회 0 |핫게kr
[4]
아빠는외계인 | 18:15 | 조회 0 |핫게kr
[3]
밀떡볶이 | 18:15 | 조회 0 |루리웹
[26]
다이바 나나 | 18:14 | 조회 0 |루리웹
[15]
이세계멈뭉이 | 18:11 | 조회 0 |루리웹
[21]
루리웹-8396645850 | 18:04 | 조회 0 |루리웹
[11]
겨울의커피 | 17:56 | 조회 569 |SLR클럽
[13]
루리웹-28749131 | 18:06 | 조회 0 |루리웹
댓글(2)
다메다메~ 다메요~ 다메 나노요~
겜 같은거 일러 한장으로 다 해먹을 수 있단거네