갤러리 이슈박스, 최근방문 갤러리
연관 갤러리
프로그래밍 갤러리 타 갤러리(0)
이 갤러리가 연관 갤러리로 추가한 갤러리
추가한 갤러리가 없습니다.
0/0
타 갤러리 프로그래밍 갤러리(0)
이 갤러리를 연관 갤러리로 추가한 갤러리
0/0
개념글 리스트
1/3
- 끼니마다 치킨햄버거는 인권침해라는 난민.. 윤어게인y
- 캡콤의 미친 모션장인정신 ㅇㅇ
- 군침군침 미국인도 질린다는 미국음식.jpg 수인갤러리
- 프랑스 시위와 한국 탄핵시위 공통점 ㄹㅇ... ㅇㅇ
- 확실히 병든 것 같은 한국인의 스펙 인식....jpg 워드
- CIA 신고로 참교육한 썰 푼다 토드하워드
- 한 늙다리 캣맘의 행적 냥갤러
- 기부 적게 한다고 악플 다는 것에 대한 이경실의 생각 ㅇㅇ
- 한강버스, 오세훈 ‘믿는 구석’ 있었다…“승객 없어도 흑자 구조” ㅇㅇ
- 바이크 주행에 도전한 추성훈의 기록 ㅇㅇ
- 장카설 중 유독 설만 약한 이유 ㅇㅇ
- ''유태금권프리메이슨'' 몬페라토
- 쯔양이 매운짬뽕을 극복하는 필승법 ㅇㅇ
- 훌쩍훌쩍 사고로 자식을 먼저 떠나보낸 자연인들 ㅇㅇ
- 싱글벙글 영포티 말고 진짜 'GOAT 세대' 영단어봇
내 영혼에는 한 줄기 잉크가 흐릅니다. (리뷰하는 만화)
안녕하세요. 어쩌다보니 보잘 것 없는 만화 덕분에 과분한 관심을 받게 되어 기쁜 마음을 주체하기 어려웠습니다. 그에 힘입어 리뷰를 그려보게 되었습니다. 거창한 건 아니고 개인적인 감상문에 가깝습니다만.. 그냥 그렇게 느꼈다일 뿐, 다른 분들의 의견과 상이할 수 있습니다. 부디 가볍게 재미로만 봐주시길 첫 리뷰라고 생각하니 뭔가 진지한 느낌으로 써버린 것 입니다.. 개인적으로 그림보다 줄 글이 많은 만화는 잘못된 만화라는 마인드를 가지고 있는데 아주 그냥 제가 괘씸합니다 그리고 쓰다보니 정주행하고 싶어서 근질근질했음 만약 언젠가 혹시라도 다시 리뷰만화??를 그릴 일이 있다면 좀 더 가벼운 느낌으로, 좀 더 만화같이 그려보고 싶네요,, 아니 그냥 개똥맛 구수하게 쓰고 싶다 뭐 재밌는거 없나 읽어주셔서 고맙습니다. 다들 좋은 하루 보내세요 !
작성자 : Navv고정닉
세레비넷)레전드 ZA 1시간 플레이 후기
https://www.serebii.net/legendsz-a/preview/ Pok Pokwww.serebii.net최근에 포켓몬 컴퍼니 인터내셔널이 저를 파리 에펠탑에서 열린 이벤트에 초청했습니다. 이 행사에서는 포켓몬 레전드: Z-A를 미리 체험할 수 있었는데, 약 한 시간 이상 게임을 직접 플레이하며 포켓몬 월드 챔피언십에서의 데모를 통해 알게 된 것보다 더 깊이 있는 요소들을 확인할 수 있었습니다. 이번 프리뷰는 네 가지 파트로 나누어졌습니다. 와일드존 탐험 – 약 20분간 자유롭게 탐험 Z-A 로얄 체험 Z-A 로얄 랭크업을 위해 반드시 이겨야 하는 트레이너 중 한 명인 린타로와의 배틀 또 다른 폭주 메가진화 배틀 – 메가 우츠보트와의 대결! 이 콘텐츠는 월드 챔피언십 데모보다 게임 진행에서 더 후반부에 해당하는 내용이라, 이번에는 게임의 변화된 시스템과 특징들을 더 확실히 체감할 수 있었습니다.와일드존제가 처음 들어간 지역은 미르시유 시티 남동쪽에 위치한 와일드존 6이었습니다. 이곳에서는 자유롭게 탐험할 수 있었는데, 상당히 넓은 구역으로 번화가, 농구 코트, 강으로 이어지는 작은 길, 건물 꼭대기까지 올라갈 수 있는 요소 등이 있었습니다.포켓몬 레전드 아르세우스와 마찬가지로, 그냥 걸어가면서 몬스터볼을 던져 포켓몬을 잡을 수 있었습니다. 이 방식은 전작과 마찬가지로 굉장히 짜릿했습니다. 물론 포켓몬이 볼에서 튀어나오면 곧장 플레이어를 공격합니다. 대부분은 잘 작동했지만, 잠든 우두머리 헬가를 잡으려 했을 때 락온 상태에서 던지면 몬스터볼이 땅에 떨어지는 문제가 있었습니다. 포켓몬의 판정 박스 중심점이 땅에 맞춰져 있어서 수동으로 조준해야 했던 것으로 보입니다.야생 포켓몬들의 반응도 다양했습니다. 헬가는 공격적으로 달려들었고, 이런 경우에는 그냥 몬스터볼을 던질 수 없어서 반드시 배틀을 해야 했습니다. 반대로 파비코는 하늘로 날아올라 전투를 피하려 했습니다. 이런 생태학적 반응들을 도시 환경 속에서 보는 것은 꽤 흥미로웠습니다.우두머리 포켓몬은 특히 까다로웠습니다. 제가 가진 포켓몬은 레벨 20대였는데, 우두머리 헬가는 레벨 34, 거북손손은 레벨 33, 피카츄는 무려 레벨 42였기 때문에 기술이 효과가 뛰어나도 데미지가 거의 들어가지 않았습니다. 이 때문에 아이템을 끊임없이 사용하며 전투를 이어가야 했고, 주변의 다른 야생 포켓몬들이 난입하는 상황도 있었습니다. 다행히 택시나 노점 같은 시가지 구조물을 엄폐물로 활용할 수 있어 이를 통해 조금은 유리하게 싸울 수 있었습니다. 결국 세 마리 모두 잡았지만, 전투 중 잠시 거리를 벌리고 다시 돌아오면 포켓몬들의 HP가 전부 회복되는 점도 확인했습니다. 헬가를 쓰러뜨렸을 때는 경험사탕도 떨어뜨렸습니다.
야생 배틀 전반에서 전략성이 두드러졌습니다. 어떤 포켓몬은 전투 시작하자마자 ‘방어’를 쓰며 제 행동을 제약했고, 위치와 거리도 중요한 요소였습니다. 예를 들어 파비코와 싸울 때는 너무 높이 떠 있어서 제 포켓몬 기술이 닿지 않았습니다. 건물 벽이나 장애물이 기술 궤도를 막는 경우도 있어, 이를 엄폐물로 활용하는 전략도 가능했습니다.플레이 도중 낮과 밤의 변화도 확인했습니다. 이는 아르세우스나 스칼렛·바이올렛처럼 실시간은 아니지만 별도의 조작 없이 자연스럽게 시간이 흐르며, 밤이 되면 배틀존이 활성화되었습니다.아쉽게도 직접 이로치를 만나지는 못했지만, 다른 참가자들을 통해 간접적으로 목격담을 들을 수 있었습니다. 아직 반짝임이나 소리가 있는지는 확인되지 않았으나 긍정적인 기대를 가져도 될 듯합니다.와일드존을 통해 게임의 스케일감을 더욱 느낄 수 있었습니다. 일부에서 도시가 작을까 걱정했지만, 제가 체험한 작은 구역만으로도 탐색할 거리가 충분했습니다. 예를 들어 거북손손의 버블빔으로 장애물을 제거하고 숨겨진 아이템을 찾거나, 지붕에 올라가 새로운 포켓몬을 만나는 경험이 있었습니다.와일드존에는 포켓몬센터가 없었고, 회복을 원할 경우 아이템을 사용하거나 카페에 가서 돈을 내고 음료를 주문해야 했습니다.
마지막으로, 포켓몬의 출현 시스템에 대해 흥미로운 점을 발견했습니다. 제가 마주친 스폰이 다른 참가자들과 동일했기 때문에, 랜덤성이 적고 아르세우스처럼 특정 스폰 지점에서 몇 종이 등장하는 방식에 가깝다고 생각됩니다. 스칼렛·바이올렛처럼 수많은 스폰 포인트에 무작위로 등장하는 구조는 아닌 듯합니다. 일부 포켓몬은 시간이 지나면서 다시 나타났는데, 그 트리거 조건은 확실히 알 수 없었습니다. 이는 출시 후 더 명확해질 부분입니다.
Z-A 로얄이번에 체험한 Z-A 로얄은 이전 월드 챔피언십 데모보다 게임 진행이 더 뒤의 시점에서 열렸습니다. 이 모드에서는 랭크 업 챌린지를 위해 총 5000점을 모아야 했고, 그 과정에서 여러 트레이너와 대결해야 했습니다.이번에는 단순 배틀뿐만 아니라 추가 과제 시스템도 확인할 수 있었습니다. 이는 남청의 원반의 블루레크와 유사하게 특정 조건을 달성하면 더 많은 점수와 코인을 얻을 수 있는 방식이었습니다. 예를 들어 효과가 굉장한 기술로 공격하기, 특정 타입의 기술로 상대 포켓몬을 쓰러뜨리기, 기습으로 한 번에 쓰러뜨리기 등의 과제가 배틀존 곳곳에 배치되어 있었고, 플레이어는 자신이 달성하기 쉬운 과제를 선택해 점수를 올릴 수 있었습니다.이번 시연에서는 체험용 파티가 상대적으로 고레벨이었기 때문에, 대부분의 배틀은 효과가 굉장한 기술 한 방으로 끝나는 경우가 많았습니다. 덕분에 큰 피해도 입지 않았고 포켓몬이 쓰러지지도 않았습니다. 하지만 그렇다고 재미가 없는 건 아니었고, 강한 트레이너를 탐색하거나 기습을 시도하는 방식은 충분히 흥미로웠습니다.프리뷰의 마지막은 린타로와의 배틀로 마무리되었습니다. 이는 랭크 업 과정에서 반드시 치러야 하는 대결 중 하나입니다. 린타로는 Z-A 로얄에서 우승해 자신의 레스토랑을 미슐랭 3스타 레스토랑으로 만드는 꿈을 가지고 있으며, 배틀에서는 야나키, 바오키, 앗차키를 사용했습니다.
배틀은 그의 레스토랑 내부에서 진행되었으며, 구조는 단순했지만 연출은 체육관전 최종전 같은 분위기를 풍겼습니다. 저는 다양한 타입의 포켓몬을 보유한 상태라 각 포켓몬에 상성 좋은 포켓몬을 교체해 내세울 수 있었고, 덕분에 큰 어려움 없이 승리할 수 있었습니다. 전투 시스템은 기존과 동일하게 작동했고, 팀 교체도 자유롭게 가능했습니다.폭주 메가진화 다음 체험은 폭주 메가 우츠보트와의 배틀이었습니다. 이는 제가 이전 데모에서 경험했던 메가 앱솔 배틀과 유사했지만, 이번에는 확실히 난도가 높아져서 이노도 전투에 참여할 정도였습니다.제가 받은 팀은 메가진화가 가능한 포켓몬들로 구성되어 있었는데, 헬가, 앱솔, 가디안이 포함되어 있었습니다. 헬가를 활용해 멀리서는 불꽃세례, 근거리에서는 불꽃엄니, 바크아웃 같은 기술로 피해를 누적시킬 수 있었습니다. 다만 우츠보트는 제 포켓몬보다는 플레이어 캐릭터 본인을 집중적으로 노렸고, 포켓몬들이 받은 피해는 어디까지나 부수적이라는 느낌이 강했습니다.우츠보트는 맵 전역에 독 웅덩이를 생성하는 광역 필드 공격도 사용했습니다. 이 웅덩이에 맞으면 포켓몬은 데미지를 입고 가끔 독 상태 이상까지 걸렸습니다. 다양한 패턴 때문에 몇 차례 전략을 재구성해야 했고, 심지어는 포켓몬이 공격을 맞기 직전에 회수해 피해를 피하는 식의 플레이도 필요했습니다. 또한, 우츠보트가 공격을 받을 때마다 메가에너지를 방출했는데, 이를 모아두는 것이 중요한 요소였습니다.
결국 저는 포켓몬을 한 마리도 잃지 않고 우츠보트를 쓰러뜨리며 우츠보트나이트를 획득했습니다. 하지만 같은 체험에 참가한 다른 플레이어들 중에서는 패배한 사례도 있어서, 난이도 체감은 플레이어마다 크게 달랐습니다.배틀 시스템와일드존의 우두머리 포켓몬 배틀, 린타로와의 랭크업 매치, 그리고 메가 우츠보트와의 대결을 통해 이번 작품의 배틀 시스템을 더욱 깊게 체감할 수 있었습니다. 단순히 “효과가 굉장한 기술을 쓰면 된다”는 수준을 넘어, 위치 선정, 기술 선택, 타이밍 같은 전략적 요소가 크게 강조된다는 점이 인상적이었습니다. 특히 야생 포켓몬이 기술을 준비중인 제 포켓몬을 직접 공격할 수 있고, 다른 포켓몬이 난입하는 상황도 빈번해, 범위 공격 기술이나 부가 효과를 가진 기술의 활용도가 높아졌습니다. 실제로 포켓몬을 26년간 플레이하면서 이렇게까지 회복 아이템을 많이 쓴 적은 처음이었습니다.능력치 변화 시스템도 기존 시리즈와 달랐습니다. 공격·방어 등 능력치는 한 번씩만 오르내릴 수 있으며, 일정 시간이 지나면 원래 상태로 돌아옵니다. 즉, 울음소리 같은 기술을 무한히 사용해 공격력을 계속 낮추는 식은 불가능합니다. 대신 전투 중간에 손해를 감수해야 하고, 상단에 붉은 화살표(상승)나 파란 화살표(하락)가 표시되어 변화 여부를 쉽게 확인할 수 있습니다. 변화가 사라지기 직전에는 아이콘이 깜박이며 알려줍니다.플러스 무브는 특히 독특한 요소였습니다. 포켓몬이 배운 기술을 플러스 무브로 강화할 수 있는데, 이 경우 위력이 올라가는 대신 메가 게이지를 소모합니다. 메가진화를 하지 않아도 게이지는 소모되며, 메가진화한 포켓몬은 모든 기술이 플러스 무브로 적용됩니다.상태이상 면에서도 변화가 있었습니다. 잠듦은 이번작에서 상태 이상으로 존재하지 않고, 전작인 포켓몬 레전드 아르세우스의 졸림 상태가 그대로 이어졌습니다.또한 특성은 삭제되었지만 지닌 도구는 존재하기 때문에, 이 부분에서도 전략적 요소가 추가됩니다.
이제는 배틀 시스템 변화에 대한 우려보다는 조심스러운 기대감을 가지게 되었습니다. 시스템 속에 확실히 재미의 불꽃이 보였고, 특히 Z-A 배틀 클럽 멀티플레이 모드가 본격적으로 공개되면 깊이 파고들어 즐기고 싶다는 생각이 강해졌습니다.기타 요소이번 체험에서는 트레이너 커스터마이징도 살펴볼 수 있었습니다. 부티크에 직접 들어가 옵션을 전부 확인할 수는 없었지만, 제공된 선택지만으로도 충분히 다양했고, 포켓몬 스칼렛·바이올렛의 제복 스타일과는 확연히 달랐습니다.진화 시스템은 포켓몬 레전드 아르세우스와 동일하게, 배틀 중이 아닐 때 포켓몬 메뉴에서 언제든지 선택해 진화할 수 있었습니다. 기술도 포켓몬 메뉴에서 바로 관리 가능했는데, 레벨업 기술과 기술머신 기술 모두 여기서 배울 수 있어 기술 확인과 교체가 매우 신속하고 편리했습니다. 예를 들어 제 치코리타가 베이리프로 진화했을 때, 메뉴에서 바로 기가드레인을 배울 수 있었고, 이 기술이 알파 거북손손과의 배틀에서 큰 도움이 되었습니다.성능 및 그래픽이번 체험은 닌텐도 스위치 2 버전으로 진행되었습니다. 물론 출시 전 빌드라 변동 가능성은 있지만, 실제 플레이에서는 매우 안정적으로 돌아갔습니다. 프레임 드롭은 전혀 느껴지지 않았고, 비주얼도 선명했습니다. 미리 공개된 시연 영상과 마찬가지로 초당 60프레임의 부드러운 움직임을 보여주었습니다.
가시거리 부분은 다소 우려되는 지점이 있었습니다. 다만 스칼렛·바이올렛과 비교했을 때, 야생 포켓몬은 멀리서도 잘 보였고, 건물 꼭대기에서 보도 위나 강가에 있는 포켓몬들까지 확인할 수 있었습니다. 배틀존에서도 큰 문제는 발견되지 않았습니다. 다만 사전 영상에서 NPC가 너무 가까운 거리에서 갑자기 나타나는 팝인(pop-in) 현상이 한 번 확인되었는데, 실제 출시 버전에서도 반복될지는 두고 봐야 할 것 같습니다.총평이번 체험을 마친 후, 전반적으로 상당히 긍정적인 기대감을 가지게 되었습니다. 물론 광활한 지역 대신 도시 환경을 중심 무대로 전환한 점에 대해서는 아직 약간의 우려가 있고, 스토리와 게임 전개가 어떻게 풀릴지 궁금합니다. 하지만 게임플레이 측면에서는 확실히 매료되었습니다. 특히 새로워진 배틀 시스템은 계속 더 깊이 파고들고 싶다는 호기심을 불러일으켰습니다.아직 이동 시스템에 대한 의문점은 남아 있습니다. 대도시 미르시티를 자유롭게 돌아다닐 때 어떤 느낌일지, 혹은 라이드 포켓몬 같은 요소가 등장할지 여부가 공개되지 않았기 때문입니다. 다만, 와일드존·배틀존·주요 거점·포켓몬센터 간의 빠른 이동 기능은 존재한다고 확인되었습니다. 실제 도시 이동이 어떻게 구현될지가 앞으로의 관건입니다.
이번 작품은 배틀 시스템과 탐험 방식 변화로 인해 호불호가 갈릴 가능성이 있습니다. 그러나 제가 체험한 기반만 놓고 본다면, 제대로 완성된다면 특별한 명작이 될 수 있는 잠재력이 충분히 보입니다.
작성자 : ㅇㅇ고정닉
생성형 AI의 기초 원리 - 3 VAE
VAE (Variational AutoEncoder) 이전 시간에는 오토인코더에 대해 알아보았고, 오토인코더의 아쉬운 점 - 더 공간을 효과적으로 모아주고, 틈이 없게끔 모아서 어디에서 뽑건 의미있는 결과가 나오면 좋겠다 - 라는 점을 생각해보았다. 그 목표를 위해서 오토인코더에 분포(Variation)개념을 넣은 것이 VAE 이다. 이름을 보면 알겠지만 평범한 오토인코더에 확률 분포라는 개념이 가미된 형태이다. + AE 를 만들 때에는 - 입력값이 잠재공간의 한 점으로 대응되지만 + VAE 를 만들 때에는 - 입력값이 잠재공간 상의 어떤 좌표 (mean) 를 중심으로하고 분산 (variance) 만큼 퍼져있는 분포로 대응된다 - 즉 한 점이라는 한개의 벡터값 대신 - 위치(mean)과 퍼진정도(variance)라는 두개의 벡터로 확장한 형태를 학습하게 된다 이렇게 하면 좋은 점이 뭘까? - 우선 공간 안에 틈이 없이 메우기 좋다. 즉 공간에 연속성이 좋아진다. 예를 들어서 오토인코더 구조에서는 (-2, 2) 라는 좌표에서 어떤 그림이 찍혀나왔다고 하더라도, 거기에서 약간 떨어진 부분 (-2.1, 2.1) 에서는 아까와 비슷한 그림이 나올거라는 보장이 없지만 VAE에서는 그게 훨씬 좋다. - 또한 VAE 는 AE 대비 잠재공간의 분포가 정규분포와 유사하게 만들어진다. 이렇게 하면 새로운 이미지를 생성할 때 성공률이 높아진다. 내가 찍은 공간이 정규분포에 속해있다면 어디를 찍어도 의미있는 이미지가 나올 가능성이 높다. 학습을 어떻게 시켜야 하나? - 기존의 레이어를 변경해서 2개의 파라메터를 학습시키도록 변경하는데, 여기서 Reparameterization Trick 이란 기법을 써서 식의 형태를 약간 변형시킨다 파라메터의 형태를 조절하는 이유는 모델의 학습과정에서 역전파가 좀 더 원활하게 작동하게 하는데에 목적이 있다. - VAE 의 경우에는 샘플링을 할 때 중점과 분포값을 각각 랜덤 뽑기를 하는 대신, epsilon 이라는 한개의 값을 정규분포에서 뽑은 다음 그걸 이전 레이어에서 넘어온 중점과 분포값과 조합하는 방식이다. - 역전파 과정에서는 두개의 변수가 하나로 합쳐지는 지점에서 편미분을 각각 계산하게 되는데, 랜덤요소가 양쪽에 있지 않고 한쪽에 몰려있는 쪽이 훨씬 잘 동작한다. * 학습은 항상 추론의 반대방향으로 계산의 흐름이 만들어지는데, 그것들을 위한 편미분 계산, 자동 미분등은 keras 나 pytorch 같은 라이브러리가 알아서 해준다. 모델을 만드는 사람이 신경쓰는 것은 양쪽 방향 모두 그래디언트가 소실되거나, 폭발하거나, 수렴되지 못하고 국소지점에 머무는 일이 발생하지 않도록 매끄러운 방향을 만들어주는 것이 중요하다 + 이런걸 어떻게 만드느냐.. 수준은 전문 연구자들의 영역이니까 우리는 그런게 있다는 것정도만 알고 넘어가자 레이어의 구조와 함께 학습의 핵심요소는 Loss 를 어떻게 정의하느냐이다 - 이전에 오토인코더에서는 높은차원의 원본 이미지를 인코더를 거치면서 낮은 차원을 통과시키면서 핵심 요소만 남겨낸 다음에 디코더를 통과하면서 다시 뿔려내면서 결과값을 만들고 그걸 처음의 원본과 얼마나 비슷한가 (reconstruction loss)를 계산했었다 - VAE 에서는 그 정보에 더해서 생성된 결과물이 최대한 정규분포에 가깝게 모일 수 있도록 추가적인 항목을 더해준다. * 두개의 확률 분포가 얼마나 가까운가, 동떨어져있는가를 계산하는 방법으로 대표적인 것이 KL 발산 이라는 것이다 * KL 발산에 대한 자세한 설명은 이쪽을 참고하자 https://www.youtube.com/watch?v=ErfnhcEV1O8 KL Divergence 에서 특기할만한 점 - 차이가 아니라 발산이다. 발산의 계산은 순서에 따라 달라진다. A분포를 기준으로 B 분포가 얼마나 발산하는가를 계산한 값과 B 분포를 기준으로 A 분포가 얼마나 발산하는가를 계산한 값은 같지 않다. - VAE에서는 최종 결과물에서 계산된 위치와 분포값이 정규분포로부터 너무 벗어나면 loss 가 늘어나게끔 구성한다 - VAE Loss = 원본 이미지와 결과 이미지의 차이점 (reconstruction loss) + 결과 이미지가 정규분포에서 얼마나 발산했는지 정도 (KL Divergence loss) - 즉, VAE에서 만든 결과는 정규분포의 범위쪽으로 모이게끔 유도된다. 결과적으로 새롭게 결과를 만들때 샘플링하기 좋아진다. 정규분포 안에서 하나 찍기만 하면 그럴듯한 결과가 나오는 보장이 AE 에 비해 VAE 가 훨씬 높다 - VAE 로 학습한 샘플들 사이에 있는 공간의 점을 찍으면 자연스럽게 그 중간 부분에 있는 모양이 찍혀나오게 된다. 굿! - 그리고 잠재공간의 형태도 정규분포에 가깝도록 KL 발산항에 의해서 유도되었기 때문에 (멀어질 수록 페널티를 줌) 원점에서 일정한 거리 안에 있는 모양이 나온다. 정규분포는 중점이 0, 발산이 1 인 분포니까 + 그래서 VAE는 본격적인 생성모델의 시작이다 스테이블 디퓨전에서 VAE 라는 단어 많이 들어봤는데? - 스테이블 디퓨전 이전에도 dall-e 나 imagen 같이 텍스트에서 이미지를 뽑는 모델들이 있었는데 - 얘네들은 각 픽셀에 대해 연산을 하느라 모델이 무겁고 소비자급 GPU에서 동작할 수 없었다 - 512*512 픽셀 전체를 생성 대상으로 하지 말고 - 64*64 정도의 작은 공간으로 줄여서 생성을 하고, 생성된 결과는 나중에 해상도 불리기를 해서 만들면 어떨까? 라는 발상으로 만들어진 것이 스테이브 디퓨전이다 - 엄밀하게 말하자면 64*64 의 데이타는 우리가 생각하는 픽셀데이타와는 똑같지 않은 형태의 latent 공간상의 embedding 이다 * 디퓨전 그림찍는 과정에서 중간 중간 프리뷰로 나오는 이미지는 생성된 임베딩을 한번 디코딩 과정을 거쳐서 낮은 해상도의 비트맵 이미지로 변환시킨 것을 표현한 것임 - 즉, 스테이블 디퓨전에서 VAE는 해상도를 뿔려주는 역할을 한다 - 64*64 공간을 512*512 의 픽셀로 업스케일링하는 것을 생각하면 64:1 의 상당한 압축비를 보여주는데, 이게 가능한 이유는 애초에 VAE 는 비슷한 근사값을 만들기만 하면 되기 때문에 손실압축의 형태로 동작하기 때문 * 이런 원리들을 이용해서 구글 포토나 유투브등에서 쓰는 고압축 코덱을 개발하기도 했다 * 비슷하게 보기 좋으면 된거 아님? 이제 본격적인 생성의 손맛을 더 알아보자 - 너무 간단한 Fashion MNIST 대신 사람 얼굴이 들어있는 CelebA 데이타셋을 갖고 학습시켜보자 - VAE 모델을 이용해서 학습을 시키고 나면 아래와 같이 원본에 대해 비슷하게 이미지를 재구성하는 능력을 모델이 획득하게 된다 VAE는 생성형 모델이기 때문에 단순히 원래 이미지를 따라하는 것 뿐만 아니라 적절한 샘플링을 통해 새로운 이미지를 생성하는 것도 가능하다 요 데이타셋에는 이미지가 이십만장 넘게 들어있는데, 특기할만한 점으로는 각 이미지마다 특징에 대한 라벨 정보가 들어있다는 점이다 * 코의 뾰족함, 앞머리, 계란형 얼굴, 수염, 표정 (웃기), 모자 착용 유무, 안경 착용 유무 등등등 - VAE 는 비지도 학습이기 때문에 학습 과정에서 이러한 라벨 정보를 쓰는 일은 없다. 그런데 VAE 학습을 하고 나서 잠재공간상의 벡터들을 보면 특정 라벨정보 매칭되는 것들을 발견할 수 있다 * 즉, 웃는 얼굴이라는 라벨을 붙여놓은 것들을 잠재공간상에서 찾아보면 서로 가깝게 몰려 있고, 수염난 얼굴, 안경, 앞머리, 모자 등도 마찬가지로 서로 모여서 의미있는 엠베딩을 만들게 된다! + 학습을 한 예제를 살펴보면 - 약간 뿌옇게 되는 단점은 있지만, 원본 데이타를 비슷하게 재생성하는 것이 가능하다는 것을 확인할 수 있고 - 잠재공간의 임베딩 벡터들을 뽑아서 각 차원별로 분포를 확인해보면, 각 차원별로 벡터의 성분이 서로 독립적으로 정규분포를 띄고 있다 - 즉 쏠림없이 잘 분포된 엠베딩을 확보했다면 n차원 정규분포 안에서 뽑기를 하는 것만으로도 새로운 얼굴을 만들 수 있고 - 특질벡터 (Feature Vector) 라는 개념을 이용해서 원하는 방향으로 샘플링 유도도 가능하다 * 웃는 얼굴이라는 특질 벡터가 몇번째 차원인지 알아냈다면 생성시 샘플링을 할 때 거기에 특성벡터를 더해주는 것만으로 결과물에 더 웃는 모습을 부여해줄 수 있다 - 연속성이 있으니까 샘플링한 두 점 사이를 보간하면서 디코딩을 하는 것으로 이미지 모핑도 쉽게 가능하다 정리 + VAE 를 통해서 본격적인 생성 AI 의 원리를 확인해보았다. - 단순히 압축률 좋게 원본 데이타셋을 모델에 압축하는 것에 그치지 않고, 공통적인 특질을 학습해서, 그걸 원하는대로 재조합해서 생성할 수 있다.
작성자 : AI활성고정닉
차단하기
설정을 통해 게시물을 걸러서 볼 수 있습니다.
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.