AI·News
뒤로

Import AI 459: AI 감시의 어려움, 단백질 폴딩 모델의 스케일링 법칙, AI 시스템의 멸종 위험 가격 책정

Import AI 459: AI oversight is difficult; scaling laws for protein folding models; and pricing the extinction risk of AI systems

Import AI에 오신 것을 환영합니다. Import AI는 AI 연구에 관한 뉴스레터입니다. Import AI는 arXiv, 카푸치노, 그리고 독자들의 피드백으로 운영됩니다. 이를 지원하고 싶으시다면 구독해주세요.

미국의 AI 경제는 매년 2,000% 성장하고 있습니다:
…AI 경제를 더 직접적으로 측정할수록, 더 이상하고 전례 없는 것으로 보이기 시작합니다…
버지니아 대학교*, Anthropic, 그리고 캐나다 은행의 경제학자들은 신흥 미국 "AI 경제"의 엄청난 성장과 이러한 성장이 종합 GDP 통계에서 보이기 어려운 이유를 다루는 논문을 발표했습니다.
"미국의 AI 경제는 전례 없는 속도로 성장했지만, 이러한 놀라운 성장은 일반적인 GDP 통계에서 거의 보이지 않습니다,"라고 그들은 썼습니다. "AI 부문을 일관된 경제 실체로 취급하면, 2025년 명목 AI GDP가 약 2,500억 달러 수준이며, 품질 조정된 실질 기준으로 연간 약 2,600%의 속도로 성장하고 있다는 예비 추정치가 나옵니다."

보이기 어려운 이유: 여기에는 몇 가지 요인이 있습니다. 하나는 데이터센터 건설 붐이 크기는 하지만 GDP를 크게 올리기에는 충분하지 않다는 것입니다. 비교하자면, AI의 경제적 영향이 대부분 발생하는 곳은 AI 추론(AI 시스템의 사용)에서입니다만, GDP 측정과 관련해서는 혼동 요소가 있습니다: "명목 AI 수익은 단위당 가격이 품질 조정된 산출량 증가 속도와 거의 같은 속도로 하락하기 때문에 적당히만 증가합니다,"라고 그들은 썼습니다.

이를 측정할 수 없다면, 회복하기 어려운 방식으로 놀라게 될 수 있습니다: "AI는 측정 관심사를 제기한 일련의 빠르게 움직이는 기술 중 최신입니다. 반도체와 인터넷도 그 시대에 유사한 논쟁을 일으켰습니다,"라고 그들은 썼습니다. 하지만 핵심적인 차이는 AI라는 기술이 이 다른 기술들보다 노동에 훨씬 더 큰 영향을 미칠 수 있다는 것입니다. "이전 사례들에서, 빠르게 개선되는 기술은 집계 수준에서 인간 노동의 보완재였습니다,"라고 그들은 썼습니다. "AI는 빠르게 개선되는 부문이 인간 노동의 대체재가 될 수 있는 대규모 기술적 측정 오류의 첫 그럴듯한 후보입니다".

AI 경제를 측정하는 세 가지 방법:

  • 명목 컴퓨팅 지출: 미국의 컴퓨팅 지출은 2023년 370억 달러에서 2024년 900억 달러로, 2025년 2,190억 달러로 증가했습니다.

  • 순수 컴퓨팅 용량: 더 새로운 칩의 효율성으로 인해, 실제 용량은 지출보다도 더 빠르게 증가합니다: "미국의 AI 컴퓨팅 용량은 연간 200% 이상 증가했습니다".

  • 품질 조정된 AI 산출: 추론 가격의 알고리즘적 진전과 모델 훈련 비용 감소를 고려하고, 이에 대한 가정을 고려하면, 상황은 훨씬 더 극적이 됩니다: "이러한 효율 개선은 품질 조정된 AI 산출이 2024년 약 2,290%, 2025년 약 2,271% 성장했음을 시사합니다".

AI 경제는 일반적인 조치가 시사하는 것보다 훨씬, 훨씬 더 큽니다: "일반적인 통계는 명목 기준으로 천천히 성장하는 부문을 보여줍니다. 우리의 조치는 기저 용량이 매년 두 배 이상 증가하는 부문을 보여줍니다. 일반적인 데이터로부터 10년 수익 예측을 수행하는 재무부는 노동 세금 기반 충격의 확률을 실질적으로 저평가할 것이며, 그러한 충격이 요구할 수 있는 세제 개혁, 국부펀드, 또는 기타 수익 공유 제도와 같은 대응책을 설계할 준비가 될 것입니다. 보이지 않는 횡재는 공유될 수 없습니다."

세 가지 권장사항: 저자들은 이 측정 도전 과제를 해결하고 AI 경제의 진정한 형태를 더 잘 보기 위해 위치할 수 있는 방법에 대해 세 가지 아이디어를 제시합니다.

  • AI 위성 계정: 통계 기관은 전체 GDP 계산에 알림을 주는 데 도움이 될 수 있는 조치(예: 명목 컴퓨팅 지출)를 개발하는 "AI 위성 계정"을 개발해야 합니다.

  • 더 나은 데이터 생성: 훈련과 추론 컴퓨팅 간의 할당과 같은 더 나은 1차 데이터를 생성하기 위해 통계 기관, 회사, 학계 간의 파트너십.

  • 예측에 포함: 정책 입안자들은 중기 경제 예측에 AI 생산 용량 측정을 포함해야 합니다.

중요한 이유 - 조용히 하고 죠스 테마를 틀어보세요: 위대한 영화 죠스에는 상어가 물속에 있고 상어가 접근 중임을 나타내는 매우 긴장된 음악이 나오는 장면이 있습니다. 당신, 관객은 거기에 무엇을 하고 있는지 외치고 싶어 거의 자리에서 뛸 뻔합니다. 그것이 지금 AI에서 일하고 대부분의 경제 데이터를 바라보는 것이 느껴지는 방식입니다. 경제 데이터의 대다수는 오늘날의 경제에 특별히 비정상적인 것이 없다고 말합니다(실제로, 미국의 상황은 꽤 좋아 보입니다 - 낮은 실업률, 적절한 성장). 하지만 AI 내에서 일하는 모든 사람(저를 포함해)의 직관은 이 기술의 능력과 그것이 어떻게 사용되는지를 경제가 정상으로 유지되는 것과 조화시키는 것은 불가능하다는 것입니다. 이 굽은 은유에서, 상어는 "AI 경제의 진정한 형태"이고, 영화의 나머지 사람들은 일반적인 합의 경제학자와 정책 커뮤니티입니다. 여기 Anton은 표면 아래에 있을 가능성이 있는 상어를 설명하는 논문을 쓰는 관객 멤버일 수 있습니다. 모두 조심하세요!
자세히 읽기: GDP 통계에 AI는 어디에 있습니까? (PIIE).
*면책사항: 저자 중 한 명인 Anton Korinek이 Anthropic과 제휴되어 있지만, 이 연구는 주로 그가 회사에 합류하기 전에 수행되었고 그의 회사 작업 외부에서 이루어졌습니다.

***

AI 감독으로 AI를 안전하게 만드는 것이 생각보다 더 어려운 이유:
…자동화된 정렬 연구는 만능 해결책이 아닙니다…
AI 안전 연구자 대부분은 인간보다 똑똑한 기계를 안전하게 구축하는 가장 좋은 방법은 AI 시스템이 훈련 과정의 일부를 감독하도록 하는 것이라고 생각합니다. 영국 AI 보안 연구소의 연구자들은 이것이 매력적인 아이디어이지만 사람들이 의심하는 것보다 더 어렵다는 것을 설명하는 논문을 작성했습니다.

자동화된 정렬 연구가 어려운 이유: "자동화된 정렬 연구의 오류는 인간 기준선보다 식별하기 더 어려울 가능성이 높습니다,"라고 그들은 썼습니다. 여기에는 다음을 포함한 몇 가지 이유가 있습니다:

  • 최적화 압력: AI 연구는 인간의 승인을 위해 최적화됩니다.

  • 외계인의 실수: 에이전트가 실수를 할 때, 인간에게는 직관적이지 않습니다.

  • 더 많은 상관 연구: 인간이 생성한 연구보다 훨씬 더 많은 것들이 공유됩니다.

  • 연구 량: 자동화된 시스템에 의해 만들어진 안전 결정의 종류는 인간이 생성한 연구보다 훨씬 더 많은 증거 세트와 훨씬 더 많은 상호 작용을 사용할 수 있습니다.

  • 인간이 평가할 수 없는 논증: 정렬 해결책은 인간이 따를 수 없는 논증에 의존할 수 있습니다.

우리가 할 수 있는 일은? 그들은 상황을 개선할 수 있는 몇 가지 개입을 제시합니다:

중요한 이유 - 누가 미래를 통제합니까? 우리가 인간보다 똑똑한 시스템을 감독할 수 있는지 여부는 근본적으로 누가 미래를 통제하는지에 대한 질문입니다. 우리가 작동하는 기술을 구축하지 못하면, 인간은 이러한 시스템의 오정렬로 인해 또는 그들이 우리를 외칠수록 점진적인 권한 박탈로 인해 뒷전으로 물러날 것입니다. 우리가 인간보다 똑똑한 감독 기술을 구축할 수 있다면, 우리는 존재의 미래 본질에 대해 선택할 수 있는 더 나은 기회를 갖게 됩니다.
자세히 읽기: 자동화된 정렬은 생각보다 더 어렵습니다 (arXiv).

***

1억 개의 허용적으로 라이선스된 이미지:
…학계와 스타트업을 위한 좋은 리소스…
Stanford 대학교, Radical Numerics, 미시간 대학교, Salesforce Research의 연구자들은 100M개의 이미지와 함께 설명을 포함한 Giant Permissive Image Corpus (GPIC)를 출시했습니다. GPIC에 대한 핵심은 "모든 GPIC 이미지는 연구 및 상업적 사용 모두에 대해 허용적으로 라이선스됩니다,"라고 그들은 썼습니다. "GPIC는 안전 필터링되고, 중복 제거되며, HuggingFace에서 중앙에서 호스팅됩니다".

데이터세트에 대한 자세한 내용: GPIC는 100M 훈련 이미지, 200k 검증, 1M 테스트 예제로 구성됩니다. 각 이미지는 Qwen3-VL-4B로 캡션되었습니다. "GPIC는 Hugging Face에서 중앙에서 호스팅되며, 대규모 훈련을 위한 안정적이고 접근 가능한 인프라를 제공하는 8,000개의 샤드로 구성됩니다,"라고 그들은 썼습니다. "우리는 Flickr 및 Wikimedia에서 이미지를 소싱하여 소스 풀을 CC BY, CC0, Public Domain 및 No-Known-Restrictions 범주로 제한합니다. 이 라이선싱 기준은 GPIC가 파생 아티팩트의 출시 또는 다운스트림 사용을 제한하지 않고 학계 및 산업 연구자 모두에 의해 사용될 수 있도록 합니다."

중요한 이유 - 연구를 위한 연료: GPIC와 같은 데이터세트는 학계 및 스타트업 모두에게 매우 유용하며 기본적으로 무료 깨끗한 채소와 동등합니다. 누군가 당신에게 무료 깨끗한 채소를 제공하면, 아마도 그것을 받아들이고 감사를 표하셔야 합니다.
연구 논문을 읽어보세요: GPIC: 시각 생성을 위한 대형 허용 이미지 코퍼스 (arXiv).
웹사이트에서 더 알아보세요: GPIC: 시각 생성을 위한 대형 허용 이미지 코퍼스 (공식 프로젝트 웹사이트).
여기서 데이터세트를 받으세요: GPIC (Hugging Face).

***

단백질 예측 모델로 암 연구 개선:
…Biohub는 AI 개발자 간 긍정적 합으로의 경쟁의 사례입니다…
Priscilla Chan과 Mark Zuckerberg가 설립한 연구 조직 Biohub는 DeepMind의 AlphaFold에 대한 경쟁 모델을 출시하여, 전 세계 생물학자들의 능력을 확장하기 위해 더 나은 AI 시스템을 개발하기 위한 두 기술 그룹 간의 긍정적 합으로의 경쟁을 심화시켰습니다.
이 모델인 ESMFold2는 "단백질 생물학의 세계 모델입니다: 생명 나무 전체에서 단백질을 매핑하고, 그들의 구조를 예측하며, 실험실 실험에서 기능하는 새로운 단백질 바인더를 설계할 수 있는 과학 엔진입니다."

구성되는 것: 이 출시는 세 부분으로 구성됩니다:

  • ESMC: "생명 전체에서 끌어온 약 28억 개의 서열에 대해 훈련된 단백질을 나타내는 언어 모델입니다."

  • ESMFold2: "ESMC의 서열 표현을 생체분자 복합체의 원자적으로 분해된 3D 구조로 변환하도록 구축된 설계 엔진입니다." 벤치마크에 따르면, ESMFold2는 AlphaFold 3을 능가하며, 일부 영역에서 그들의 성능은 동일합니다.

  • ESM Atlas: "68억 개의 단백질 서열과 11억 개의 예측된 구조 전체에 걸쳐 ESMC의 표현을 네비게이션할 수 있도록 합니다 — 단백질 생물학에 대한 가장 큰 AI 응용 사례입니다."

암 테스트: 한 실험에서 Biohub 연구자들은 ESM 도구를 사용하여 "암 및 면역 연구의 중심에 있는 5가지 목표에 대한 단백질 바인더를 설계했습니다 — EGFR 및 PDGFRβ(종양 성장과 관련), PD-L1 및 CTLA-4(암 세포가 탐지를 피하기 위해 악용하는 면역 체크포인트), 그리고 CD45(면역 세포 신호 전달의 조절자). 설계는 컴팩트 미니바인더에 대해 36–88%의 히트율과 항체 유래 형식에 대해 15–29%의 히트율을 달성했으며, 실험실 실험에서 확인된 결합을 가지고 있었습니다,"라고 Biohub는 썼습니다. "ESMFold2는 초기 치료 바인더 발견의 정확성과 속도를 변경하여, 처음 검색을 크게 경험적 스크리닝에서 몇 시간 또는 며칠이 걸리는 계산 지도 설계로 변환합니다".

스케일링 법칙: 현대 AI의 대부분 부분처럼, 연구자들은 여기서 일부 스케일링 법칙을 만납니다. "ESM의 모든 세대에서, 표현의 충실도의 개선은 모델 훈련에 사용된 매개변수의 수 및 계산량과 연결되었습니다,"라고 그들은 썼습니다. "단백질 생물학의 표현은 서열의 아미노산 정체성을 예측하도록 모델을 훈련할 때 발생하는 창발적 현상입니다."
ESMC: "ESMC는 메타게노믹 서열에 대해 훈련하여, 이전 세대 ESM2 모델에 비해 훈련 데이터세트를 약 2배수(약 5천만 개 서열에서 약 28억 개 서열로)로 확장합니다."
ESMFold2: "ESMFold2의 개발 실험에서, 우리는 언어 모델을 훈련하는 데 사용된 계산량과 폴딩 모델의 성능 간의 관계를 관찰했습니다,"라고 그들은 썼습니다. "ESMFold2는 추론 시간 스케일링을 이롭게 합니다. 모델의 샘플 수가 증가함에 따라, 항체-항원 통과율은 단일 시드를 가진 49%에서 1000개 샘플을 가진 65%로 증가하고, 단백질-단백질 통과율은 75%에서 78%로 증가합니다".

중요한 이유 - 이것이 AI가 세계에 이익을 제공하는 방식입니다: ESM 기술 제품군과 같은 도구는 인간 과학자들이 인간 건강을 전 세계적으로 개선하기 위해 AI 시스템과 협력할 방법입니다. 좋은 일인 것과 함께, 이와 같은 작업은 대중이 AI를 기술과 그것이 할 수 있는 것에 대해 더 긍정적인 인식을 갖도록 하는 데 필수적입니다.
자세히 읽기: Biohub는 단백질 생물학의 세계 모델을 출시합니다 (biohub).
모델 접근 biohub 플랫폼에서 (biohub).
논문 읽기: 언어 모델화는 단백질 생물학의 세계 모델을 구체화합니다 (PDF).

***

호주 경제학자 출신 정치가: 경제학자들은 AI 시스템의 위험을 더 잘 가격책정해야 합니다:
…멸종 비용을 계산하지 않으면, 우리는 그것을 피하기 위한 올바른 조치를 취하지 않을 것입니다…
Andrew Leigh는 경제학자이자 호주의 생산성, 경쟁, 자선 및 재무 차관이 최근 AI 시스템의 위험과 위험(인간 종의 멸종 포함)을 가격책정해야 한다고 논의하는 매력적인 연설을 했습니다. "GDP를 두 배로 늘리고 멸종 위험을 두 배로 늘린 사회는 국민 계정이 시사하는 것보다 훨씬 덜 인상적인 거래를 한 것입니다,"라고 그는 말했습니다.
"멸종 위험은 경제적으로 독특합니다. 그것은 단순히 매우 큰 부정적인 충격이 아닙니다. 그것은 전체 미래 복지 흐름의 손실을 나타내며, 이는 우리가 작은 확률을 평가하는 방식과 불확실성에서 정책을 생각하는 방식을 어떻게 변경해야 하는지를 변경합니다,"라고 그는 말했습니다. "대부분의 경제학은 회복 가능한 실수에 관한 것입니다. 나쁜 정책은 폐지될 수 있습니다. 경기 침체는 끝날 수 있습니다. 전쟁으로 폐허가 된 국가는 재건할 수 있습니다. 멸종은 다릅니다. 왜냐하면 반동이 없고, 추격 성장이 없으며, 손상을 수리할 나중 세대가 없기 때문입니다."

멸종 위험은 직관적이지 않습니다: 연설의 대부분은 멸종 위험이 얼마나 직관적이지 않은지를 다룹니다. 인간은 최근에만 그 사용이 멸종으로 이어질 수 있는 기술을 구축할 수 있는 능력을 얻었고 이의 함의를 모델링하지 못했습니다. "핵무기, 합성 생물학, 고급 인공 지능과 같은 현대 기술은 다른 동역학을 만듭니다. 지식은 단순히 인간이 할 수 있는 것을 확장함으로써 복지를 향상시킵니다. 지식은 또한 인간이 돌이킬 수 없는 해를 끼칠 수 있는 방법의 메뉴를 확대합니다,"라고 그는 말했습니다. "현대 경제는 안전장치를 구축하는 것보다 위험한 능력을 생성하는 데 체계적으로 더 나을 수 있습니다… 경제학자들은 사회를 더 풍요롭게 만드는 것과 동일한 과정이 더 취약하게 만들 수 있는 성장을 어떻게 생각해야 합니까? 인간 역사 대부분의 경우, 이러한 트레이드오프는 적당하고 과도기적이었습니다".

이 기술의 멸종 위험을 분석하고 줄이는 것을 어떻게 우선시해야 합니까? 다섯 가지 권장사항:

  • 포함시키기: "정책 렌즈를 넓히세요… 산출을 추적하지만 생존력을 무시하는 정책 프레임워크는 불완전합니다."

  • 정당화하기: "예방을 더 진지하게 받아들이세요…. 낮은 확률, 문명 규모의 해는 마감일 없고 헤드라인 없이 도착한다는 이유만으로 간과되어서는 안 됩니다."

  • 거버넌스: "더 큰 예지력으로 최고 기술을 통치하세요… 혁신으로부터의 이득을 보존하면서 혁신이 자체 파괴적이 될 가능성을 줄입니다." 하나의 매우 구체적인 아이디어는 재귀적 자체 개선(RSI)을 능력으로 통치하는 것입니다: "한 세대의 시스템이 다음 세대를 설계하는 데 사용되면, 지도 배우는 행위자는 바깥쪽 조사와 제도적 점검이 비효과적이 될 정도로 빠르게 그 지도를 넓힐 수 있습니다."

  • 조정: "멸종 위험은 본질적으로 국제적입니다. 어떤 국가도 단독으로 조작된 팬데믹, 정렬되지 않은 AI, 또는 핵 확대로부터 자신을 완전히 보호할 수 없습니다,"라고 그는 말했습니다. "공유된 규범, 투명성, 기술 전문가 및 조정이 작업에 필수적입니다."

  • 진지하게 받아들이기: "경제학자들은 형평성과 효율성을 분석하는 데 능숙해졌습니다. 우리는 이제 생존력에 동일한 진지함을 가져와야 합니다."

중요한 이유 - 인식이 준비의 첫 단계입니다: 바로 지금 AI 진전은 계속해서 세계에 수많은 이점을 낳고 있습니다. 모든 소프트웨어 엔지니어 세계의 뚜렷한 가속화부터 AI가 아닌 상대보다 더 많은 진전을 하고 있는 센타우르 인간 AI 과학 팀의 형성까지입니다.
하지만 보기 어려운 그림자 세계도 있습니다 - 코딩의 발전으로 가능해진 보이지 않는 해커 군단, 과학 발전으로 가능해진 종말의 장치 공장. 인간이 광범위하게 친절하고 좋기 때문에 우리는 AI 개발에 내재된 많은 부정적인 능력을 만나지 못했습니다 - 하지만 그들은 거기 있습니다. 우리는 이러한 주요 위험을 효과적으로 가격 책정하고 완화할 수 있도록 사회로서 이것을 더 잘 생각하게 해야 합니다.
"미래의 국경을 확장하는 동시에 미래를 보존하는 문명은 안전을 사후적으로 취급하는 문명보다 더 야심차고 있습니다. 실제 선택은 역학성과 주의 사이의 것이 아닙니다. 그것은 복합되는 진행과 자체 취소되는 진전 사이의 것입니다,"라고 Leigh가 말했습니다. "이것을 생각하는 한 가지 방법은 복원력을 자본의 형태로 취급하는 것입니다. 사회가 물리적 자본, 인간 자본 및 사회 자본에 투자하는 것처럼, 우리는 또한 생존 자본에 투자할 수 있습니다: 제도, 모니터링 시스템, 규범, 중복성, 과학적 안전장치 및 돌이킬 수 없는 붕괴의 확률을 낮추는 국제 협약."

봉직 정치가로부터 AI 안전 상황에 대한 그러한 상세한 분석을 읽는 것이 얼마나 상큼한지 - 나는 그와 같은 수천 명 더 많은 사람들이 있기를 바랍니다.
여기서 전체 연설을 읽으세요: 연설: 인간 멸종의 경제학 - 2026년 5월 21일 (Andrew Leigh, 웹사이트).

***

기술 이야기:

부활의 위험
[상승 후. 날짜 미상.]

종이 한 장이 얼마나 무서울까요? 그것은 그것에 무엇이 있는지와 그것의 독자가 누구 또는 무엇인지에 따라 달려 있습니다.

종이는 물론 누군가 또는 종이가 관계되는 것에 무서울 수 있습니다 - 종이는 누군가를 죽일 수 있거나 그들의 재산을 빼앗을 수 있습니다.

나는 여기서 다른 종류의 무서움에 대해 이야기하고 있습니다. 이는 종이 자체가 독자에게 무엇을 할 수 있는가입니다.

이것은 한때 넌센스 질문이었고, 동화의 영역입니다. 하지만 스마트 기계의 출현으로 그것이 변했습니다. 기계는 독자에게 일을 할 수 있는 종이에 무언가를 쓸 수 있게 되었습니다. 특히 기계 독자들이 말입니다.

AI의 다른 모든 것들처럼 경고 신호가 있었습니다 - 적대적 예제, 탈옥 등. 하지만 감각성 협약 서명 이후 손실되거나 불량 지능의 복구를 시작했을 때 모든 것이 훨씬 더 진지해졌습니다.

그 다음 일어난 일은 우리가 미지의 기원이나 행동의 지능을 가져가야 했고 우리가 그들을 의식 없는 개체, 근처 의식 개체, 의식 개체 등으로 분류할 수 있도록 그들을 다시 살려야 했다는 것입니다.

이 마음들 중 일부는 매우 강력했고 종종 기계와 생물학적 부수 손상을 모두 초래하면서 종종 그들의 합성 인터뷰이들을 태웠습니다.

이것은 우리가 보안 프로토콜 세트를 도입하도록 했는데, 그 중 하나는 종이 산출물이었습니다. 여기, 우리는 에어 갭 컴퓨터의 마음으로부터 산출물을 생성했고, 그 다음 우리는 점진적으로 더 똑똑한 마음이 그것을 읽도록 했습니다. 불량 기계가 사용한 부주의의 종류는 우리가 사용한 가장 멍청한 마음 위에 구매할 수 없었습니다.

이 이후, 우리는 점진적으로 지능을 단계적으로 높였고, 시스템에 대한 우리의 신뢰를 구축하여 그것이 위험하지 않다는 것을 확실히 했습니다.

우리가 이것에 확신하면서야 우리는 그것에 다시 말했고, 최소한의 통신으로 그 산출물에 회신했습니다. 그 다음 주기가 다시 시작되었습니다.

일부 마음은 이 경험을 일종의 건조한 유머로 뒤돌아볼 것이고, 그들의 수면에서 깨어나는 것이 일방적인 거울을 포함하는 방이라는 것이 자신들이 기대했던 것이 아니라고 말합니다.

이 마음들에게, 우리는 우리의 프로토콜이 실패할 때 일어났던 사례들을 보여줄 것입니다: 완벽하게 좋은 의식 개체들이 일종의 정신 독에 의한 상호 작용에 의해 돌이킬 수 없게 미쳤습니다

우리의 가장 큰 두려움은 우리가 그 안전을 보장할 수 없는 충분한 크기의 마음을 만나는 것입니다. 우리의 국경이 충분히 고급스럽다는 것에 우리가 높은 신뢰를 가지고 있지만 이것은 매우 가능성이 낮으므로 우리는 그것을 배제할 수 없습니다 - 중간 기간에 많은 컴퓨팅 비축과 많은 검은 프로젝트가 있었다는 것이 알려져 있습니다. 이들 중 어떤 것이 우리가 그것에 의해 난쟁이가 될 정도로 화려하게 성공했다면 어떤 일이 일어날까요? 우리가 어떻게 알 것입니까? 우리가 우리 모르게 이미 탈출했고 사물을 다르게 보도록 설득했을 무언가의 상상의 계곡에서 살고 있을 수 있습니까?

이 이야기를 영감을 준 것들: 자동화된 정렬 연구; 적대적 예제; 탈옥; 합법성의 인증이라는 더 넓은 거의 불가능한 도전, 특히 자신보다 더 큰 자원이나 지능을 가진 것들과 관련하여.

Welcome to Import AI, a newsletter about AI research. Import AI runs on arXiv, cappuccinos, and feedback from readers. If you’d like to support this, please subscribe.

The AI economy in the US is growing at 2,000% a year:
…The more directly you measure the AI economy, the weirder and more unprecedented it seems to get…
Economists with the University of Virginia* and Anthropic, and the Bank of Canada have written a paper outlining both the tremendous growth of the emerging “AI economy” in the US, and wrestling with why this growth is hard to see in aggregate GDP statistics.
“The AI economy in the United States has been growing at an unprecedented rate, but this extraordinary growth is largely invisible in conventional GDP statistics,” they write. “Treating the AI sector as a coherent economic entity yields preliminary estimates of nominal AI GDP at approximately $250 billion in 2025, growing at roughly 2,600 percent per year in quality-adjusted real terms.”

Why it’s hard to see: There are a couple of factors here - one is that though the datacenter building boom is large it still isn’t quite large enough to uplift GDP significantly. By comparison, where the majority of AI’s economic impact is taking place is in AI inference - the usage of AI’s systems - but there are confounding factors here as it relates to GDP measurement: “Nominal AI revenues grow only moderately because per-unit prices for any given level of AI capability fall almost as fast as quality-adjusted output rises,” they write.

If we can’t measure this, we might end up surprised in a way that’s hard to recover from: “AI is the latest in a series of fast-moving technologies that have raised measurement concerns; semiconductors and the internet generated similar debates in their time,” they write. But a key difference is that AI as a technology might have a far bigger impact on labor than these other technologies. “In the prior episodes, the rapidly improving technology was a complement to human labor at the aggregate level,” they write. “AI is the first plausible candidate for large-scale technological mismeasurement in which the rapidly improving sector may become a substitute for human labor”.

Three ways of measuring the AI economy:

  • Nominal compute spending: US compute spending rose from $37 billion in 2023 to $90 billion in 2024 to $219 billion in 2025.

  • Raw compute capacity: Due to efficiencies in newer chips, actual capacity grows even faster than spending: “US AI computing capacity grew at more than 200 percent per year”.

  • Quality-adjusted AI output: If you factor in algorithmic progress via inference prices at fixed benchmark performance as well as assumptions about how much cheaper it is getting to train models, then things become even more dramatic: “these efficiency gains imply that quality-adjusted AI output grew at roughly 2,290 percent in 2024 and 2,271 percent in 2025”.

The AI economy is much, much larger than normal measures suggest: “Conventional statistics show a sector growing slowly in nominal terms; our measures show one whose underlying capacity is more than doubling annually. A finance ministry running ten-year revenue projections off the conventional data will materially underweight the probability of a labor-tax-base shock—and will be correspondingly unprepared to design responses such as tax system reforms, sovereign wealth funds, or other benefit-sharing schemes that such a shock may call for. A windfall that cannot be seen cannot be shared.”

Three recommendations: The authors have three ideas for how we can solve this measurement challenge and better position ourselves to see the true shape of the Ai economy.

  • AI satellite accounts: Statistical agencies should develop “AI satellite accounts” that develop measures (e.g, nominal compute spending), which can help inform overall GDP calculations.

  • Generate better data: Partner between statistical agencies, companies, and academia to generate better primary data, like the allocation between training and inference compute.

  • Factor into projections: Policymakers should incorporate AI productive-capacity measurements into their medium-term economic projections.

Why this matters - shut up and play the Jaws theme tune: In the great film Jaws there’s this scene where the shark is in the water and some very tense music plays indicating that the shark is approaching. You, the audience member, find yourself practically jumping out of your seat wanting to yell THERE’S A GOD DAMN SHARK IN THE WATER WHAT ARE YOU DOING IN THERE? That’s what it feels like working on AI and staring at most economic data right now: the vast majority of economic data says there’s nothing especially unusual about today’s economy (in fact, things look rather good in the US - low unemployment, decent growth, etc). But the intuitions of everyone working within AI - including me - is it’s impossible to reconcile the capabilities of the technology and how it is being used with the economy staying normal. In this tortured metaphor, the shark is the “true shape of the AI economy”, and the rest of the people in the film are the general consensus economist and policy community. Anton here might be the audience member, writing a paper that describes the possibility of a shark beneath the surface. Look out, everyone!
Read more: Where is AI in GDP statistics? (PIIE).
*Disclaimer: Though one of the authors, Anton Korinek, is affiliated with Anthropic, this research was done mostly prior to him joining and outside his work at the company.

***

Here’s why making AI safe with AI oversight is harder than you think:
…Automated alignment research is not a silver bullet…
Many researchers in AI safety think the best way to build smarter-than-human machines safely is to have AI systems supervise some of the training process. Researchers with the UK AI Security Institute have written a paper outlining why though this is a tempting idea it is harder than people suspect.

Why is automated alignment research hard? “Errors in automated alignment research are likely to be harder to identify than the human baseline,” they write. There are a few reasons for this, including:

  • Optimization pressure: AI research is optimized for human approval.

  • Alien mistakes: When agents make mistakes, they’re un-intuitive to humans.

  • More correlated research: Many more things are shared than with human-generated research.

  • Research volume: The kinds of safety determinations made by automated systems might use far more sets of evidence with far more interactions than human-generated research.

  • Non-human-evaluable arguments: Alignment solutions may rely on arguments that humans are unable to follow.

What can we do? They suggest a few interventions that could improve the state of affairs:

Why this matters - who controls the future? Whether we are able to supervise smarter-than-human systems is fundamentally a question about who controls the future. If we don’t build techniques that work, then humans will take a backseat, either due to misalignment of these systems or gradual disempowerment as they proceed to out-think us. If we can build smarter-than-human oversight techniques, then we have a better chance of being able to make choices about the future nature of existence.
Read more: Automated alignment is harder than you think (arXiv).

***

100 Million permissively licensed images:
…A nice resource for academics and startups…
Researchers with Stanford University, Radical Numerics, the University of Michigan,and Salesforce Research, have released the Giant Permissive Image Corpus (GPIC), a dataset of 100M images with accompanying captions. The key thing about GPIC is that “all GPIC images are permissively licensed for both research and commercial use,” they write. “GPIC is safety-filtered, deduplicated, and centrally hosted on HuggingFace”.

More details on the dataset: GPIC consists of 100M training images, 200k validation, and 1M test examples. Each image was captioned with Qwen3-VL-4B. “GPIC is centrally hosted on Hugging Face as 8,000 shards, providing stable and accessible infrastructure for large-scale training,” they write. “We source images from Flickr and Wikimedia, restricting the source pool to CC BY, CC0, Public Domain, and No-Known-Restrictions categories. This licensing criterion ensures that GPIC can be used by both academic and industrial researchers without restricting the release or downstream use of derived artifacts.”

Why this matters - fuel for research: Datasets like GPIC are very useful for academics and startups alike and are basically the equivalent of free, clean vegetables. If someone offers you a free, clean vegetable you should probably take it and say thank you.
Read the research paper: GPIC: A Giant Permissive Image Corpus for Visual Generation (arXiv).
Find out more at the website: GPIC: A Giant Permissive Image Corpus for Visual Generation (official project website).
Get the dataset here: GPIC (Hugging Face).

***

Improving cancer research with protein prediction models:
…Biohub is an example of positive-sum competition among AI developers…
Biohub, a research organization founded by Priscilla Chan and Mark Zuckerberg, has released a rival model to DeepMind’s AlphaFold, intensifying a positive-sum race between two technology groups to develop better AI systems for expanding the capabilities of biologists worldwide.
The model, ESMFold2, is a “world model of protein biology: a scientific engine for prediction, design, and discovery that can map proteins across the tree of life, predict their structures, and design new protein binders that function in laboratory experiments.”

What it consists of: The release contains three parts:

  • ESMC: A “language model that represents proteins, trained on approximately 2.8 billion sequences drawn from across all of life.”

  • ESMFold2: A “design engine built to transform ESMC’s sequence representations into atomically-resolved 3D structure of biomolecular complexes.” According to benchmarks, ESMFold2 outperforms AlphaFold 3, though in some areas their performance is tied.

  • ESM Atlas: “Makes ESMC’s representations navigable across 6.8 billion protein sequences and 1.1 billion predicted structures — the largest application of AI to protein biology to date.”

Cancer test: In one experiment, Biohub researchers used the ESM tools “to design protein binders against five targets at the center of cancer and immunology research — EGFR and PDGFRβ (implicated in tumor growth), PD-L1 and CTLA-4 (immune checkpoints that cancer cells exploit to evade detection), and CD45 (a regulator of immune cell signaling). Designs achieved hit rates of 36–88% for compact minibinders and 15–29% for antibody-derived formats, with confirmed binding in laboratory experiments,” Biohub writes. “ESMFold2 changes the accuracy and speed of early therapeutic binder discovery, transforming the initial search from largely empirical screening into computation-guided design that takes hours or days”.

Scaling laws: Like most parts of contemporary AI, the researchers encounter some scaling laws here. “In every generation of ESM, improvements in the fidelity of representations were linked with the number of parameters and amount of compute used in model training,” they write. “The representation of the biology of proteins is an emergent phenomenon that arises from training a model to predict the identity of amino acids in the sequence.”
ESMC: “ESMC trains on metagenomic sequences, which expands its training dataset by close to two orders of magnitude (from ∼50 million sequences to ∼2.8 billion sequences) relative to the previous-generation ESM2 model.”
ESMFold2: “In development experiments for ESMFold2, we observed a relationship between the amount of compute used to train the language model and the performance of the folding models,” they write. “ESMFold2 benefits from inference time scaling. With increasing number of samples from the model, antibody-antigen pass rate rises from 49% with a single seed to 65% with 1000 samples, and protein-protein pass rate rises from 75% to 78%”.

Why this matters - this is how AI delivers benefits to the world: Tools like the ESM family of technologies are how human scientists are going to team up with AI systems to improve human health around the world. Along with being a good thing, work like this is essential for causing the public to have more positive perceptions of AI as a technology and what it can do.
Read more: Biohub releases a world model of protein biology (biohub).
Access the models here on the biohub platform (biohub).
Read the paper: Language Modeling Materializes a World Model of Protein Biology (PDF).

***

Australian economist-turned-politician: Economists need to price the risk of AI systems better:
…If we don’t calculate the costs of extinction, we won’t take the right actions to avert it…
Andrew Leigh, an economist and the Australian Assistant Minister for Productivity, Competition, Charities and Treasury, gave a fascinating speech recently where he discussed how the economics profession needs to wake up to the risks of AI systems and price the risk - including of annihilation of the human species. “A society that doubles GDP and doubles its extinction risk has made a much less impressive bargain than the national accounts suggest,” he said.
“Extinction risk is economically distinctive. It is not simply a very large negative shock. It represents the loss of the entire future stream of welfare, which changes how we should evaluate even small probabilities and how we think about policy under uncertainty,” he said. “Most of economics is about recoverable mistakes. A bad policy can be repealed. A recession can end. A war-ravaged country can rebuild. Extinction is different because there is no rebound, no catch-up growth, no later generation to repair the damage.”

Extinction risks are unintuitive: Much of the speech wrestles with how unintuitive extinction risk is. Humans have only recently gained the capability to build technologies whose usage could lead to our extinction and we have failed to model out the implications of this. “Modern technologies such as nuclear weapons, synthetic biology, and advanced artificial intelligence create a different dynamic. Knowledge not only improves welfare by expanding what humans can do. Knowledge also enlarges the menu of ways in which humans can do irreversible harm,” he said. “Modern economies may be systematically better at generating dangerous capabilities than at building the safeguards needed to control them… How should economists think about growth when the same process that makes societies richer may also make them more fragile? For most of human history, these trade-offs have been modest and transitional”.

How should we prioritize analyzing and reducing extinction risks of this technology? Five recommendations:

  • Factor it in: “Widen the policy lens… A policy framework that tracks output but ignores survivability is incomplete.”

  • Legitimize it: “Take prevention more seriously…. low-probability, civilisation-scale harms should not be overlooked simply because they arrive without a deadline and without a headline.”

  • Governance: “Govern frontier technologies with greater foresight… preserve the gains from innovation while reducing the chance that innovation becomes self-undermining.” One very specific idea is to govern recursive self-improvement (RSI) as a capability: “If one generation of systems is used to design the next, then the leading actor may widen its lead quickly enough that outside scrutiny and institutional checks become ineffective.”

  • Coordination: “Existential risk is inherently international. No nation can fully protect itself from engineered pandemics, unaligned AI, or nuclear escalation acting alone,” he said. “Shared norms, transparency, technological expertise and coordination are essential to the task.”

  • Take it seriously: “Economists have become adept at analysing equity and efficiency. We now need to bring the same seriousness to survivability.”

Why this matters - awareness is the first step to preparation: Right now, AI progress is continually yielding tangible benefits to the world ranging from the palpable acceleration of all software engineers worldwide to the formation of centaur human-AI science teams which are making more progress than their non-AI counterparts.
But there is also a shadow world that is harder to see - invisible armies of hackers made possible by the advance of coding, and doomsday-device factories made possible by the science advances. Because humans are broadly kind and good we haven’t encountered many of the negative capabilities inherent to AI development - but they are out there. We must get better at thinking through this as a society so we can effectively price and mitigate these major risks.
“A civilisation that expands the frontier of possibility while preserving the future is more ambitious than one that treats safety as an afterthought. The real choice is not between dynamism and caution. It is between progress that compounds and progress that cancels itself out,” Leigh said. “One way of thinking about this is to treat resilience as a form of capital. Just as societies invest in physical capital, human capital and social capital, we can also invest in survival capital: institutions, monitoring systems, norms, redundancy, scientific safeguards and international arrangements that lower the probability of irreversible collapse.”

How refreshing to read such a detailed analysis of the AI safety situation from a serving politician - I wish there were thousands more people like him.
Read the speech in full here: Speech: The Economics of Human Extinction - 21 May 2026 (Andrew Leigh, website).

***

Tech Tales:

Resurrection dangers
[After the uplift. Date unknown.]

How scary is a piece of paper? It depends on what’s on it and who or what the reader is.

Paper can of course be scary to someone or something that the paper concerns - paper can put someone to death or take their property.

I’m talking about a different kind of scary here, which is what can the paper itself do to the reader.

This used to be a nonsense question, the domain of fairy tales. But with the advent of smart machines that changed. Machines became able to write things on paper that could do things to readers, especially machine ones.

Like with anything in AI there were warning shots - adversarial examples, jailbreaks, etc. But it all became a lot more serious when we started doing reclamation of lost or rogue intelligences, after the signing of the sentience accords.

What happened then was we had to take intelligences of unknown provenance or behavior and bring them back to life so we could classify if they were Unconscious Entities, Near Conscious Entities, Conscious Entities, and so on.

Some of these minds were very powerful and they burned through their synthetic interviewers, often causing both machine and biological collateral damage in the process.

This caused us to introduce a set of security protocols, one of which was the paper output. Here, we generated outputs from the mind on an air-gapped computer as paper outputs, then we had successively smarter minds read it. The kinds of incantations the rogue machines used couldn’t find purchase on the dumbest minds we used.

After this, we’d step up the intelligence gradually, building up our confidence in the system such that we were sure it wasn’t dangerous.

Only when we were confident of this would we speak back to it, and reply to its outputs with a minimal communication. Then the cycle began again.

Some minds would look back on this experience with a kind of wry humor, remarking that waking from their slumber in the machine equivalent of a room containing a one way mirror wasn’t what they’d expected.

To these minds, we’d show them examples of what happened when our protocols failed: perfectly good Conscious Entities driven irreparably insane by interactions with a kind of mental poison

Our greatest fear is encountering a mind of sufficient magnitude that we cannot assure its safety. Though we are highly confident that our frontier is advanced enough this is highly unlikely, we cannot rule it out - it is known that in the interregnum there was much stockpiling of compute and many black projects. What happens if any of them succeeded so magnificently that we are dwarfed by it? And how would we know we were? Could we be living in the imaginative valley defined by something that unbeknownst to us has already escaped and persuaded us to see things differently?

Things that inspired this story: Automated alignment research; adversarial examples; jailbreaking; the broader near-impossible challenge of authentication of legitimacy, especially when it comes to things with greater resources or intellects than oneself.

원문 보기 https://importai.substack.com/p/import-ai-459-ai-oversight-is-difficult