갤러리 이슈박스, 최근방문 갤러리
연관 갤러리
AKB48 갤러리 타 갤러리(0)
이 갤러리가 연관 갤러리로 추가한 갤러리
0/0
타 갤러리 AKB48 갤러리(0)
이 갤러리를 연관 갤러리로 추가한 갤러리
0/0
개념글 리스트
1/3
- 궁금한 이야기 Y 근황 ㅇㅇ
- 윤석열, 계엄 당일 "국립병원 폐쇄시켜라" 지시.JPG ㅇㅇ
- 체육 선생님을 사랑했던 노사연 감돌
- 탄핵반대집회 여시 반응 ㅋㅋㅋ ㅇㅇ
- 중국군 최악의 중국인 학살사건...JPG 부갤러
- "비상계엄, 정당한 결단"...탄핵 반대 집회도 잇따라...jpg 빌애크먼
- 탄핵집회, 중국인 조직적 정치집회 개입확인 헬기탄재매이
- 충격】여성시대 인지부조화 왔다!! ㅇㅇ
- 윤석민 이썰은 좀 재밌네요 후후..jpg ㅇㅇ
- 싱글벙글 올해도 성공적으로 끝난 크리스마스 공수 작전.JPG 최강한화이글스
- 건담(건프라) 좋아하는 한국 연예인들 모음 라라
- 민노총 테X 주의보 123번뇌왕
- 싱글벙글 오늘자 가요대축제 베이비복스 재결합 jpg 코카코
- 트리하우스 지점들 리뷰 + 특징 정리 저끼
- 제네시스, WEC 경쟁을 위한 V8 엔진 계획 공개 ㅇㅇ
하이브 산재 은폐 결과뜸 걸장연들 또 개같이 패배
https://n.news.naver.com/article/022/0003996387?sid=102 [단독] 고용노동부, 하이브 산재 은폐 의혹에 “위법성 없음” 종결일자리 으뜸기업 철회 심사위원회 12월 개최 ‘직원 과로사 은폐 의혹’이 제기된 하이브에 대해 고용노동부가 법 위반 사항이 없다는 결론을 내렸다. 이번 결론은 하이브의 일자리 으뜸기업 철회 심사에 반영되는 만큼 최종n.news.naver.com겠냐?ㅋㅋㅋㅋㅋ- 진짜 그팬들은 왜 이렇게까지 하는거냐국감에서도 유족이 산재신청이나 부검신청을 하지 않았다는사실 대신 전했고이번 조사결과에서도 또 한번 유족의 입장이 재차 밝혀졌으면사례가 사례인만큼 넘어가야지 또 좌표찍고 베댓먹고 저러고있네베댓먹은 인간들 추천순 댓글보면 뭐하는 인간들인지 뻔히보이는yukk라는 인간은 말할것도 없고ㅇㅇ그냥 이 인간들은 노동자, 산재 이런거에 진짜 관심이 있는게 아니잖아합민사태에서 여론전 우위를 점할 카드가 사라져서 이러는거잖아어떻게든 이미지 깎아내려고 도구로 사용했다는걸 자백하는꼴
작성자 : ㅇㅇ고정닉
광화문 집회 실시간
- 관련게시물 : 尹 탄핵 반대 광화문 집회 ··· 대규모 보수 단체 총결집!못가서 죄송합니다.- 실시간 광화문.cctv- 실시간 더민당갤지는 인터넷에 글 싸지르면서 시위 참여하라는건 뭐임..?- 광화문 웅장해지노- 광화문 도착 - dc official App- 광화문 온 부산사람 이제도착 벅차오른다!!대한민국! 윤석열 대통령 지키자 - dc official App- 탄핵찬성하는새끼들 광화문왔다가 돌아감ㅋㅋㅋ이재명! 구속! 종북좌파! 척결!구호소리듣고 얼굴빨개지면서 탄핵찬성 카드 숨기고 도망감 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ- 옳게된 전라도...jpg 광주 보수우파 광화문 집결ㄷㄷ- 성조기 이미 크게 걸려있음차선벽에 크게 계속 걸려있고 1시 집회 시작하면앞쪽에 사람들 다 피켓들고 태극기 성조기 듬- 이시각 광화문 집회 상황1시 시작인데 벌써 이만큼 오심계속 사람들 합류하는중 ㅋㅋ - 얘네 광화문에서 어르신들 태극기를 뺏어가네?미친년들아닌가 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ- dc official App- 광화문 보수 집회 후기 jpg사이비 전광훈 신도들 대부분 ㅋㅋㅋ- 실시간 민갤 저격하는 에타 내란견분탕 본인이 친 다음 저러는 건가 의심간다 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ - 좌파 집회 근황이래딱 기다려라 애국 우파들이 움직인다- dc official App- 현재시각 경복궁 cctv ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ다합쳐서 100명도 안되는거 아니노? ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ- 광화문 사람많이 왔네 끝이 안보인다- 민주당 갤피셜 집회 사람이 너무 없다느그들 쫄았제?ㅋㅋ- 인원수 모자라니까 어떻게 선동 하는지 아냐?한줌단 2030대 비율 높아욧!!하... 그래 소녀시대 '다만세' 노래 틀고 응원봉 흔들어라- 더민갤근황아니 근데 중국인이 참여해도 되는거야? - dc official App- 내일도 응원해줘 우리가 지켜야한다 - 자유 시민 vs 빨갱이들 비교 집회 실시간1,2가 탄핵 반대 시민들 집회3,4가 빈자리 텅텅 빨갱이들- 탄핵반대 드론 사진펜X마XX 에서 영상 캡처해서 올림유튜브 이름 나오면 차단 먹을까봐 짤라서 올림상관없나?- 탄핵집회에 나온 고3 여고생.jpg고3? - 현시간 광화문에 왔다가 시무룩해진 트좌좀들야 우냐?ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ그와중에 서코는 포기 못하는반일씹덕들 능지ㅋㅋㅋㅋㅋㅋㅋㅋ- 신고부탁) 집회에 화염병 예고하는 좌파페미..혹시 모르니 조심해라.. 이거 누가 신고 좀 해주라 https://x.com/argentum1895/status/1870123752778006565?t=2zePMfd-lWkJOCiNZmbVsg&s=19 -> 원본글 링크임 - dc official App- 또 다시 날조 시작하는중 광화문에 모인 사람들이 탄찬시위하러 나간거냐?진심이야???? 이게 나라 맞지?????- YTN 미친새끼들존나 추하네 ㅅㅂㅋㅋㅋㅋㅋ - dc official App- 민좆당 실시간 자위중ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ이번주는 푹 쉬잔다 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ- 화염병 신고후기발화자 1 (00:00) 네 여보세요 아 경찰관입니다. 네 그 신고하셨죠. 네 지폐에 화염병 뭐 들고 간다고 네 그게 어디서 보고 저. 발화자 2 (00:15) 트위터 트위터 SNS. 발화자 1 (00:18) 아 SNS 트위터. 발화자 2 (00:20) 그때 화염* 들고 간다고 사진을 올려가지고. 발화자 1 (00:24) 오 트위터 네 어 어디로 간다고 말은 않고요? 거기서? 발화자 2 (00:31) 그 광화문 그 탄핵 시위가 간 걸로 알고 있어요. SNS 보면은? 발화자 1 (00:38) 광화문. 발화자 2 (00:39) 찬성 네 탄핵 탄성 집회. 발화자 1 (00:44) 한 해 찬성에 아 차라리 찬성이 그렇게 간다고 네 언제쯤 그렇게 했었는가요? 발화자 2 (00:52) 그게 사진이 올라왔거든요. 발화자 1 (00:56) 어 네 사진이. 발화자 2 (01:05) 그 화염*은 어제 올라왔고요. 발화자 1 (01:08) 어제 네 화염*은 어디에? 발화자 2 (01:11) 그리고 오늘은 30분 전에 화면 돈 들고 집회 참석했다고 사진을 올렸거든요. 발화자 1 (01:20) 아 화염*을 본인이 든 사진을 올렸다. 네 오늘 몇 시쯤인가요? 발화자 2 (01:28) 30분 전에. 발화자 1 (01:30) 와 30분 전에 네 음 탄핵 찬성 집회 간다. 네 신고자 번호 어디서 지금 거주하신가요? 발화자 2 (01:45) 저는 광주에. 발화자 1 (01:46) 옆에 있어요. 광주 네 광주에서 그 보고 지금 전화 신고하시는 거네요. 발화자 2 (01:54) 네 SNS 봐가지고. 발화자 1 (01:56) 음 알겠 알겠습니다 트위터라는 건가요 트위터? 발화자 2 (02:01) 네 그래서 제가 그 링크 보냈었거든요. 발화자 1 (02:04) 아 링크. 발화자 2 (02:06) 예 들어가시면은 내용 있으니까 바로 보실 거예요. 발화자 1 (02:10) 아 예 알았습니다. 고마워요. 네. 네. - 진짜 민노총 가관이네ㅋㅋ설치한 라바콘 발로 쳐 까고 바리케이드 넘어뜨리고 뭔짓 할지도 모르니 광화문분들 조심하세요.. - dc official App- 얘네 갑자기 인원 늘어나거 특징한명 한명 늘어나는 게 아니라무슨 단체처럼 무리가 한번에 들어옴라이브로 아까 보였는데사회주의 전진 깃발 또 등장 ㅋㅋㅋ고로 반미 단체반미집회임멀리서 보면 사람 별로 없음 ㅋㅋㅋ사람 줏도 없으니깐 가까이서 찍은 거거기다 저기 경복궁 가는 외국인 관광객도 어마어마함 ㅋㅋㅋㅋㅋ- 민족 정론지 MBC... PIP 방송 레전드조그맣게 찬성집회 화면 띄우고 소리도 저 내용 송출함 ㅋㅋㅋㅋㅋ - 이건 진짜 선 넘은거 아니냐?- 실시간 광화문 탄핵반대 역대급 인파. jpg이게 인파라는거다동덕 시위대들아 ㅋㅋㅋㅋ- 실시간 CIA에 쫄아버린 탄핵 찬성집회ㅋㅋㅋㅋㅋㅋ차만 슝슝슝슝회ㅋㅋㅋㅋㅋㅋㅋㅋㅋ- ㅋㅋㅋ 오마이뉴스 유튜브 존나 웃기네채팅화력 밀리니까 구독자전용으로 바꿨음 ㅋㅋㅋㅋㅋ구독하고 싸울까 하다가 개씨발 언론은 피하고 싶어서 걍 포기함 ㅋㅋ- 펌) 광기의 태극기ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ20분뒤 도착이다 - 마음이 ㅈㄴ 불안한 시위녀- dc official App
작성자 : ㅇㅇ고정닉
오늘 o3-mini 시연으로 보여준 것
1. o3-mini(hard)에게 mac에서 o3-mini API를 사용해서 코드를 생성하고 바로 실행하는 프로그램을 UI와 함께 만들라고 지시다음과 같은 내용에 대한 Python 스크립트를 작성해주세요:HTML 파일을 로컬에서 서버로 실행하는 스크립트가 필요합니다. 이 HTML 파일에는 큰 텍스트 상자가 있어야 합니다. 텍스트 상자에 내용을 입력하고 제출 버튼을 누르면:-해당 요청을 OpenAI의 o3-mini API로 전송해야 하며, medium reasoning_effort 설정을 사용합니다-API로부터 받은 코드를 데스크톱의 임시 파일로 저장합니다-새로운 파이썬 터미널에서 그 파일을 실행합니다추가 세부사항:-API 키는 ~/api_key 위치에서 찾을 수 있습니다-API 요청 시 원시 코드만 반환하고 포매팅이나 마크다운을 전혀 포함하지 않도록 추가 프롬프팅을 넣어주세요-Mac 노트북에서 실행될 예정입니다2. 그렇게 해서 만든 코드3. 3. o3-mini(hard)가 직접 만든 터미널이제 저기에 아무거나 입력하고 submit을 누르면o3-mini(medium) API를 통해 코드를 생성하고,생성된 코드를 임시파일로 저장하고,임시파일로 저장된 코드를 파이썬으로 실행하는 것 까지 수행프롬프트에는 위처럼 간단하게 openai를 프린트하고 아무 숫자나 프린트하라고 시킴4. 실행 결과openai 41 이라고 결과가 나온 모습(즉, o3-mini API로 프롬프트를 보내서 코드를 짰고, 그 코드의 실행 결과가 openai 41이 된 것)5. 이제 좀 더 난이도를 높여서, o3-mini에게 너 자신의 GPQA 점수를 직접 평가하라는 프롬프트를 만듬-특정 url로 들어가서 평가 데이터셋을 다운 받고, API 사용방법에 따라 제대로 코드를 짜야하고,다운받은 데이터셋을 o3-mini(low) API로 보내서 결과를 얻고,나온 결과를 Answer: 형태로 깔끔하게 나오게 해서 평가가 가능할 수 있게 해야함그리고 async를 사용해서 병렬처리가 가능하게 하고, api 콜이 실패하지 않도록 robust하게 만들어야함등의 지시 사항이 담김6. 그렇게 해서 나온 결과61.62%라고 점수가 바로 계산됨자기 자신이 스스로를 원큐에 평가한 것 7. 그 뒤에 멘트들"내년에는 모델에게 너 자신을 개선해라 라고 명령해봐야겠네요"이 과정이 라이브에서 찐빠없이 이루어진게 개인적으론 매우 놀라웠음o3-mini가 이정도면 o3는 그냥 말이 안되는 수준일듯- o3 벤치마크가 가지는 의미Codeforces, FrontierMath, GPQA 하나같이 다 인간 최상위권들 수준의 문제들임어느 정도일까?Codeforces : 코딩 고인물들만 참가하는 대회여기서 99832명 중 50위 내, 즉 상위 0.05% 달성보통 Candidate Master만 되도 인간 최상위권인데, 그 중에서만 따져도 0.7% 내에 들음ELO 2500점만 되도 국제올림피아드 진출권이라는 걸 생각하면, 보통 인생 살면서 이 정도로 코딩 잘하는 사람은 보기도 힘듬AIME(미국 수학 올림피아드) 96.7%, GPQA (박사 수준 추론 질문) 87.7%웬만한 사람은 아무리 공부해도 이 정도에 도달하는 건 불가능참고로 GPQA는 해당 분야 박사 학위도 평균 65%의 정답률을 보임FrontierMath : 대놓고 현존하는(했던) 인공지능들 엿먹이려고 만든 수학 벤치마크수학 평생 공부하면서 박사까지 전공한 사람들도 자기 분야랑 딱 맞는 거 아니면 못 푸는 문제들만 있음공식 사이트(https://epoch.ai/frontiermath)에 있는 언급 : Terence Tao : 이 문제들 ㅈㄴ 어려움. AI가 이거 풀려면 적어도 몇 년 걸릴 듯 Timothy Gowers(필즈 메달 수상자) : 이거 다 푸는 건 고사하고, 한 문제 제대로 푸는 것도 우리가 지금 할 수 있는 걸 넘어선다 Evan Chen (국제수학올림피아드 코치) : 정말로 어려운 문제들이고, 대부분 내 능력을 뛰어넘는다ARC-AGI (일반 추론 평가) : 진짜 인간다운 추론을 하는지 테스트하기 위해 만든 데이터셋일반적인 사람이 풀었을 때 85% 정도의 정답률을 보임o3는 여기서 생각 시간에 따라 76%-87%의 정답률을 보임걍 기존 벤치딸들과는 차원이 다른 수준임GPQA, FrontierMath, ARC-AGI 얘네들은 전체 문제는 비공개고 예시를 위한 일부 문제만 공개돼있기 때문에,벤치 미리 학습했네 이 ㅈㄹ도 못함- 오늘 발표에서 가장 놀라웠던 부분. NO.1사진을 보면 알다시피 o3는 코드포스에서 2727점을 기록.“o3는 최고 세팅에서 거의 2727과 같은 결과를 얻을 수 있었습니다.”“샘: 아주 좋습니다. 당신(가운데 앉아있는 엔지니어 마크 첸)의 기록은 어떻습니까? 마크 첸: 저의 최고 점수는 약 2500이었습니다.”• “우리의 수석 과학자도 이 점수를 넘지 못했는데, 이 점수는 수석 과학자 야코프의 점수를 능가합니다.”아마 한 명이 더 높은 점수를 낸 것 같습니다.” “점수는 아마 OpenAI에서 3000점을 유지하는 사람이 한 명 있는 것 같아요.”“그 점수도 몇 달 더 지나면 가능할 것 같아요.”이번에 o3가 코드포스에서 2727점을 기록했으며,가운데 앉아있는 초엘리트급 엔지니어 마크 첸(자긴 2500점대라 주장함), 심지어 일리야 후임인 야코브(현 OpenAi 수석과학자 아래 인물)마저 뛰어넘고 유일하게 오픈AI 내에서 3000점 이상인 사람이 딱 한명만 존재함…ㄷㄷㄷ“FEEl THE AGI.”- [OpenAI] 방금 역사상 가장 똑똑한 AI가 탄생하였음어제부터 시작된 심상치 않은 분위기그리고 갑자기 The Information 기사가 하나 올라오는데...그리고 약속의, 새벽 3시.담담하게 발표하는 그들..."O3 모델은 아주 아주 똑똑한 모델입니다. 그리고 O3 Mini 모델도 믿을 수 없을 정도로 똑똑한 모델이에요."----------SWE-bench Verified (Software Engineering):실제 GitHub 이슈를 바탕으로 하여, 코드베이스를 수정하여 문제를 해결할 수 있는지를 평가. 소프트웨어 개발자로서 충분히 생산적인지를 확인.Codeforces (Competition Code):프로그래밍 경쟁 대회. 다양한 난이도의 알고리즘 문제를 해결하는 능력을 평가. 다양한 알고리즘 문제를 효과적으로 해결할 수 있는지를 확인.모두 0-shotsGithub 이슈, 실제 프로덕트에 대한 실질적인 해결 능력이 71%까지 올라갔다는 것을 의미함과 동시에,전세계 상위 0.2% 국제적인 그랜드마스터급 실력(정확히는 전세계 175위)의 알고리즘 문제 해결 능력을 보유했다는 것을 의미.AIME 2024 (Competition Math):중고등학생 수학 경시 대회. 기하학, 조합론, 정수론, 대수학 등 다양한 분야에서 창의적이고도 고도의 논리력과 사고력을 요구하는 문제들로 구성되며, 여기서 만점을 받는다는 것은 영재 중의 영재이자 추후 수학의 신계가 될 자들만이 가능함. 애초에 응시하는 것부터가 AMC라는 대회에서 상위 5% 미만이어야지만 응시 가능.Questions (GPQA Diamond) (Phd-level Science):박사 수준의 생물학, 물리학, 화학 문제를 해결하는 능력을 평가. 해당 분야의 박사들조차 평균 65%의 정답률밖에 달성하지 못함.해당 부문들에 있어서 대략적으로 인간 전문가를 한참 뛰어넘었다고 볼 수 있겠다.EpochAI Frontier Math (Research Math):60명 이상의 최고급 수학자들이 참여하여 만든 역대급 수학 문제들. 14명의 국제수학올림피아드 금메달리스트와 필즈상 수상자들(테렌스 타오, 티모시 고워스, 리처드 보처드)이 머리를 싸매고 만든 수학 시험. 전문 수학자도 딱 한 문제 해결에 수 시간부터 수 일이 소요. 단순한 패턴 매칭이나 기존 학습 데이터만으로는 해결할 수 없는 진정한 수학적 추론 능력을 측정.기존의 모든 AI들은 2.0%의 수준밖에 안 되었는데, o3는 25.2%까지 끌어올렸다.ARC-AGI:일반인공지능(AGI)의 핵심인 추상화와 추론 능력을 측정하는 테스트. 단순한 패턴 매칭이나 통계적 학습이 아닌, 진정한 지능을 측정하고자 설계.인간 평균 수준은 70%.ARC Prize 창립자왈:"OpenAI의 o3 모델은 ARC-AGI 벤치마크에서 뛰어난 성능을 보여주며, 기존 LLM의 한계를 극복하고 지식 재조합 능력을 향상시켰습니다. 이는 단순한 성능 향상을 넘어, AI가 새로운 과제에 적응하는 능력이 크게 발전했음을 보여줍니다. ARC Prize는 새로운 벤치마크를 통해 AI 연구 발전을 계속해서 추진할 것입니다."나머지Structured Outputs:개발자가 제공한 스키마에 따라 출력을 정확하게 구조화하는 능력. JSON, 데이터베이스, 자동화된 처리 등에 적합한 일관된 형식의 출력을 보장.Function Calling:외부 도구나 API와 상호작용할 수 있게 해주는 능력. 텍스트 생성을 넘어 실제 작업을 수행하고 데이터를 검색 및 처리할 수 있음.Function Calling with Structured Outputs:Function Calling과 Structured Outputs을 결합한 고급 능력.LiveBench Coding:다양한 코딩 능력 평가 시험. 문제 이해 능력, 기존 코드 기능 파악, 누락된 부분 완성 능력 등을 다양한 문제들로부터 평가.https://youtu.be/SKBG1sqdyIU
작성자 : ㅇㅇ고정닉
차단하기
설정을 통해 게시물을 걸러서 볼 수 있습니다.
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.