AI·News
뒤로

Import AI 456: RSI와 경제성장; AI 규제에 대한 급진적 선택지; 신경 컴퓨터

Import AI 456: RSI and economic growth; radical optionality for AI regulation; and a neural computer

Import AI에 오신 것을 환영합니다. AI 연구에 관한 뉴스레터입니다. Import AI는 arXiv, 카푸치노, 그리고 독자들의 피드백으로 운영됩니다. 이를 지원하고 싶으시다면 구독해주세요.

규제할까? 규제하지 말까. 세 번째 방법이 있습니다: 급진적 선택 가능성:
…정부는 향후의 위기에 대비하기 위해 지금 필요할 수 있는 도구에 투자해야 합니다…
법과 AI 연구소의 연구자들이 "급진적 선택 가능성"에 대해 저술했습니다. 이는 강력한 AI가 세상을 대규모로 혼란에 빠뜨리기 시작할 경우 정부가 미래에 필요할 수 있는 도구를 자신들에게 제공하는 접근 방식입니다.
"근본적으로 급진적 선택 가능성은 상황이 변함에 따라 변환적 AI 시스템을 통제하는 방법에 관해 좋은 결정을 내릴 민주주의 정부의 능력을 보존하는 것에 관한 것입니다. 단기적으로 이는 과도한 규제를 피하면서 광범위한 시나리오에 능숙하게 대응하기 위해 필요한 제도, 정보 채널, 법적 권한을 신속히 구축하는 것을 의미합니다."

핵심 아이디어 - 불확실한 미래에 대비해 지금 투자합니다: AI 개발의 엄청난 이해관계를 고려할 때, "정부는 선택 가능성을 보존하기 위해 엄청난 양의 돈, 노력, 정치적 자본을 기꺼이 지출할 의지가 있어야 합니다"라고 그들은 썼습니다. 즉, 이것은 매우 큰 일이므로 불확실한 수익으로 지금 많은 돈을 쓰는 것이 괜찮아야 한다는 뜻입니다. "정부는 역효과를 낼 수 있는 개입을 경계해야 하지만, 순 긍정적 결과를 낼 가능성이 있어 보이는 현실적인 어떤 조치의 실제 금전적 비용에 대해서는 크게 신경 쓸 필요가 없습니다."

구체사항: 그들은 또한 몇 가지 범주의 몇 가지 구체적인 개입을 권장합니다:

  • 정보 수집 권한: 기업이 자신의 AI 시스템에 관한 정보를 공개해야 하는 투명성 요구사항. 기업이 정부 기관과 특정 정보를 공유하도록 강제되는 보고 요구사항. 이러한 조치들이 제자리에 있으면 제3자가 투명성 및 보고 규칙이 목표하는 것의 진정성을 확인할 수 있도록 감시 체계를 확립합니다.

  • 내부고발자 보호: 최첨단 연구소의 직원들이 위험에 관한 정보를 보고할 수 있도록 보장합니다.

  • 정부 내 및 정부 간 정보 공유: 정부가 효과적으로 조정하고 토론을 촉진할 수 있도록 보장합니다. 특히 AI의 진전에 관한 민감한 정보를 다루는 경우입니다. 이것은 AI 개발에 중요한 것으로 간주되는 공급망을 강화하고 보호하는 데 특히 중요할 수 있습니다.

  • 유연한 규칙과 정의: 조건부 "만약-그러면" 규제 약속을 잠재적으로 함으로써 조기 규제를 피하거나, 높은 수준의 목표(예: 위험 완화)가 설정되고 기업이 그렇게 하는 방식의 구체적인 사항을 자유롭게 정의할 수 있는 접근 방식입니다. 이는 시간에 따라 진화할 수 있는 유연한 정의 또는 정의를 고안할 필요성과 연결되어 있습니다.

  • 평가 및 평가: AI 시스템의 능력 및 안전 측면을 평가하기 위한 정부 및 제3자 역량을 개발합니다.

  • 모델 가중치 및 알고리즘 비밀의 보안 개선: 신경망의 가중치와 최고 시스템 뒤의 알고리즘 비밀을 보호하는 데 더 많이 투자합니다. 이는 물리적 보안 및 사이버 보안에 대한 자발적 표준을 공포함으로써 달성할 수 있습니다.

  • 고용 및 인력: 위의 모든 개입을 효과적으로 수행하는 데 필요한 기술 인력에 더 많이 투자하는 메타 투자입니다. 이의 핵심은 AISI(영국) 및 CAISI(미국) 및 다른 국가의 그들의 대응물의 자금 조달을 늘리는 것입니다.

주장과 반론: 저자들은 이러한 아이디어에 대한 몇 가지 보다 명백한 반대 주장을 살펴보고 몇 가지 응답을 제공합니다:

  • 극적인 규제 조치 조장: 위의 아이디어들은 "남용에 빌려질 수 있는 실질적인 권한이 아닙니다"라고 그들은 주장합니다. (이에 대해 저는 충분히 동기가 있는 정부는 원래 권한을 초안 작성한 사람들이 생각했을 수 있는 것보다 훨씬 더 강력한 권한 버전을 생각해 낼 수 있다는 점을 지적하여 이의를 제기할 수 있습니다).

  • 민주적 정당성: 유연성을 최적화하면 민주적 정당성과 더 관련된 것들, 예를 들어 일부 규칙 제정 유형의 고지 및 의견 수렴 기간을 면제하도록 기관에 권한을 부여하는 것을 강조 해제할 필요성이 생길 수 있습니다.

  • 권력의 집중 및 정부 남용: 저자들은 정부가 AI 시스템의 개발에 대한 통제를 주장할 상당한 위험이 있다는 것에 "기본적으로 확신합니다" - 이런 이유로 그들은 국방 생산법과 같은 응급 권한의 범위를 대대적으로 확장하는 것과 같은 것을 권장하지 않습니다. 이를 완화하는 한 가지 방법은 정부가 "오직 법을 준수하는 AI 시스템만 사용"하도록 하는 것일 수 있습니다.

  • 민간 거버넌스가 뭐가 문제예요? 그냥 그렇게 하지 않을까요: 저자들은 "규제 시장" 관점의 아이디어를 지지하지만, 주로 민간 부문 행위자(예: 독립적 검증 조직)의 다발에 의존하는 어떤 거버넌스도 여전히 정부 내 기술 역량의 기본 주머니에 의존하게 될 것이라고 생각합니다.

이것이 중요한 이유 - 성공을 위한 세상을 설정합니다: 저는 여기의 모든 권고사항에 동의하며 최근 몇 년 동안 많은 권고사항을 옹호했습니다. 사회로서 다가올 잠재적으로 절대적으로 거대한 변화에 대비하기 위해 할 수 있는 수많은 것들이 있는 것으로 보입니다. "이러한 정책을 구현하는 비용은 잠재적 이점에 비해 미천합니다. 대조적으로 행동하지 않을 비용은 잠재적으로 재앙적입니다"라고 저자들은 씁니다. 나는 동의합니다.
더 읽기: Radical Optionality (공식 논문 웹사이트).

***

Schmidhuber 특별 - 신경 컴퓨터:
…어쩌면 운영 체제는 일시적인 유행일 뿐입니다..
Meta와 KAIST의 재미있는 논문 신경 컴퓨터는 "신경망이 기존 컴퓨터처럼 작동할 수 있을까?"라는 질문을 던집니다. 신경 컴퓨터(NC)는 학습된 런타임 상태에서 계산, 메모리, I/O를 통합하는 신경 시스템입니다.
이 논문은 몇 가지 이유로 흥미롭습니다: 1) AI 커뮤니티에서 종류의 전설인 Juergen Schmidhuber의 것이며, 많은 중요한 것들을 초기에 개념화했습니다(예: 생성 모델, 세계 모델, 생성 적대 네트워크의 측면, 비디오 게임에 대한 벤치마킹에 관한 초기 생각), 그리고 2) 아이디어는 그렇게 터무니없고 단순해서 그것이 작동할 수도 있습니다(비록 오늘날의 모델이 가진 것보다 훨씬 더 많은 계산과 데이터를 필요로 할지라도).

큰 아이디어: 저자 중 한 명이 말했듯이, 오늘날의 AI를 사용하면, "새로운 기계 형태가 나타나기 시작하고 있습니다". 그런 다음 그들은 물었습니다: "에이전트가 실제 작업을 더 잘하고, 세계 모델이 내부 시뮬레이션을 더 잘하고, 기존 컴퓨터가 이미 AI를 위해 그들의 기판을 재구축하고 있다면, 실행, 롤아웃, 능력 보존을 같은 학습 기계로 가져오는 새로운 런타임이 있을 수 있을까요?... 제 자신의 추측은 성숙한 [신경 컴퓨터]가 다른 기판을 가리킨다는 것입니다: 더 희소하고, 더 주소 지정 가능하고, 약간 더 회로 같은 10T-1000T 기계처럼."

두 개의 실험: 이것은 주로 강력한 생성 비디오 모델(Wan 2.1)과 잘 선별된 훈련 데이터를 사용하여 명령줄 인터페이스(CLI)와 그래픽 사용자 인터페이스(GUI)를 기반으로 일부 신경 컴퓨터를 만들 수 있는지 여부를 탐색하는 초기 프로토타이핑을 수행하는 개념 논문입니다. 두 접근 방식 모두 작동하지만, 매우 '라이트 형제 이륙 전' 의미에서입니다 - 훨씬 더 큰 미래를 겨우 가리키고 있습니다.
CLI: "NC는 기본 명령줄 워크플로를 렌더링하고 실행하는 방법을 배웁니다. 그것은 종종 터미널 버퍼와 정렬 상태를 유지하고 일상적인 CLI 사용의 일반적인 '물리학'을 포착합니다(예: 빠른 스크롤백, 프롬프트 래핑, 창 크기 조정). 하지만 기호적 안정성은 제한된 상태입니다."
GUI: "우리는 전역 충실도, 사후 작업 반응성, 커서 정확도 측정을 사용하여 데이터 품질, 커서 감독, 작업 주입, 작업 인코딩 전반에 걸쳐 표준 세계 모델 설계를 평가합니다."

프로토타입이 작동합니다: "우리의 실험 통찰력은 현재 NC가 이미 기본 런타임 원시를 실현하는 방법을 배울 수 있음을 나타냅니다. 가장 주목할 점은 I/O 정렬 및 단거리 제어입니다. 장기 목표는 완전히 신경 컴퓨터(CNC), 이 기계 형태의 성숙하고 범용 실현입니다: 계산, 메모리, 인터페이스가 별도의 모듈로 엔지니어링되는 대신 단일 학습된 런타임 기판으로 통합되는 완전히 학습된 컴퓨터입니다."

이것이 중요한 이유 - 어쩌면 미래에는 모든 소프트웨어가 큰 신경망의 가중치 안에 있을 것입니다: 이 논문은 컴퓨터를 지탱하는 모든 소프트웨어를 전통적인 의미에서 제거하고 단순히 거대한 신경망으로 대체하는 미래를 가리킵니다. "신경 컴퓨터는 단일 잠재 런타임 상태가 컴퓨터 자체로 작용하여 픽셀, 텍스트, 작업을 구동하면서 운영 체제와 인터페이스가 처리하는 것을 포괄하는 기계 형태를 향하고 있습니다"라고 그들은 씁니다. "CNC로의 진행은 더 강력한 모델뿐만 아니라 재사용, 일관성, 거버넌스가 지속되고 테스트 가능해지는지 여부에도 달려 있을 것입니다". 그러한 시스템은 엄청나게 유용하고, 오늘날 우리가 가진 시스템과 엄청나게 달랐으며, 그것의 존재는 우리 자신이 시뮬레이션에 살고 있을 가능성을 엄청나게 증가시킬 것입니다.
더 읽기: 신경 컴퓨터 (arXiv).
블로그 포스트 읽기: 신경 컴퓨터: 새로운 기계 형태가 나타나고 있습니다 (Mingchen Zhuge, 블로그).

***

재귀적 자기 개선은 폭발적인 경제 성장으로 이어질 수 있습니다:
…경제학자들은 RSI가 전례 없는 경제 호황을 야기할 수 있음을 시사하는 몇 가지 모델을 구축합니다…
Forethought, Columbia University, University of Virginia의 경제학자들과 연구자들은 AI 시스템의 재귀적 자기 개선(#455) (또는 심지어 경제의 큰 덩어리의 극도의 자동화)가 경제를 전례 없는 호황으로 몰아가는 복리 피드백 순환을 시작할 수 있다고 생각합니다.
"우리는 AI 기반 자동화가 두 힘과 상호작용하는 방식을 분석하기 위한 틀을 개발하며, 자동화에 의해 생성되는 피드백 루프가 경제를 폭발적 성장으로 몰아가는 조건을 식별합니다"라고 그들은 씁니다. "이 모델은 자동화가 폭발적 동역학을 생성하는 두 가지 구별되는 채널을 식별하며, 이러한 채널들은 서로를 강화합니다. 첫 번째는 혁신 네트워크 전체의 기술 피드백 루프입니다… 두 번째 채널은 더 높은 산출이 추가 경제 성장을 이끌기 위해 배포할 수 있는 더 많은 자원을 생성하는 경제적 피드백 루프입니다."

주요 결과: "모든 부문에 걸친 13% 자동화는 경제를 폭발적 체계로 밀어내기에 충분하며, 소프트웨어 및 하드웨어 연구만 자동화될 때 17%로도 충분합니다. 두 번째, 하드웨어 연구는 지배적인 수단입니다 – 하드웨어 수익이 소프트웨어보다 대략 5배이고 집계 TFP보다 10배이기 때문에, 칩 설계의 한 작업을 자동화하는 것은 소프트웨어의 5개 작업이나 최종 재화 생산만큼 경제를 움직입니다. 하드웨어만의 20% 자동화는 임계값을 넘기기에 충분합니다. 세 번째, 소프트웨어 자동화 단독은 대략 칼날의 가장자리 근처입니다: 상당히 보수적인 보정에서, 경제의 다른 부분을 자동화하지 않고 소프트웨어 연구를 완전히 자동화하면 폭발적 성장 임계값에 겨우 도달합니다. 다른 곳의 작은 밀어붙임이 체계를 기울리기에 충분합니다."

특이점이 당신이 생각하는 것보다 더 가까울 수 있습니다: "우리의 기준선 양식 시뮬레이션에서, 소프트웨어 R&D의 완전한 자동화와 경제의 나머지 부분에 대한 5% 자동화를 포함하는 '자동화 충격'은 특이점이 대략 6년 내에 도착하게 합니다"라고 그들은 씁니다. "경증적으로 최근의 소프트웨어 및 하드웨어의 생산성 성장률은 그렇게 엄청나게 빨랐고, 따라서 새로운 균형 성장 경로로의 전환 또는 쌍곡선 가속이 극도로 빠르게 일어날 가능성이 있습니다."

하드웨어가 열쇠입니다: "우리의 결과는 반도체 연구 및 개발의 전략적 중요성을 강조합니다."

정책 입안자들에게 주목: "AI R&D 활동에서의 자동화 수준을 모니터링하는 것은 전통적인 거시경제 지표를 추적하는 것만큼 중요할 수 있습니다. 주요 연구 부문의 자동화 정도는 잠재적 성장 가속화의 초기 경고 시스템으로 작용할 수 있습니다. 이것은 AI 회사의 경제학자들이 측정하고 공개적으로 공유할 수 있는 것입니다."

이것이 중요한 이유 - RSI가 발생하면, 경제를 혁명화해야 합니다: 이 논문은 재귀적 자기 개선 - 자신의 후속 개발을 자동화할 수 있는 AI 시스템 - 이 경제에 주요 영향을 미쳐야 한다는 아이디어 뒤에 일부 경제 이론을 넣습니다. 제 관점에서 놀라운 것은 경제 전체를 통한 피드백이고, 경제 전체에 자동화 기술의 광범위한 확산의 결과로 '경제적 특이점'을 칠 수 있음을 시사합니다. 또 더 많은 증거 우리는 종으로서 급진적인 미래로 향하고 있을 수 있습니다.

작은 이해 충돌 주의: 이 논문의 저자 중 한 명인 Anton Korinek은 이제 Anthropic에서 저와 함께 일합니다. 그는 자신의 논문을 발표했고 저는 같은 날 제 RSI Import AI 포스트를 발표했으며, 둘 다 다른 사람의 작업을 알지 못했습니다.
더 읽기: AI 연구 자동화가 폭발적 성장을 만들 때? 혁신 네트워크의 피드백 루프 (NBER).
트윗 스레드에서 더 보기 (Anton Korinek (X).

***

Google은 세상을 계산하고 싶습니다:
…분산 훈련이 또 다른 발걸음을 디딥니다…
이 뉴스레터에서 저는 더 적은 계산을 가진 행위자들이 자신들이 다른 방식으로 훈련할 수 없는 AI 시스템을 훈련하기 위해 자원을 모으는 것을 가능하게 하는 관점에서 분산 훈련에 대해 몇 년을 써왔습니다. 하지만 Google의 새로운 논문, Decoupled DiLoCo, 분산 훈련 기법이 또한 규모의 다른 끝에서 작동할 수 있음을 강조합니다. Google과 같은 회사가 데이터 센터 전체의 다른 유형의 컴퓨터의 큰 덩어리를 합쳐 대규모로 모델을 훈련할 수 있도록 합니다.

그들이 한 일: Decoupled DiLoCo는 Google의 'DiLoCo' 패밀리의 이전 작업의 확장입니다. 여기서 주요 발명은 Google이 "계산의 별도 섬(학습자 단위로 알려진)을 통한 비동기 훈련을 해제할 수 있다"는 것입니다. 한 영역의 칩 실패가 다른 것들의 진행을 중단하지 않습니다."
이것의 결과는 Google이 단일 훈련 작업에 더 많은 유형의 계산을 모으고 또한 자신을 더 실패에 탄력적이도록 만드는 것입니다. "Decoupled DiLoCo를 Gemma 4 모델과 함께 테스트하면, 하드웨어가 실패할 때, 시스템은 더 전통적인 훈련 방법보다 더 큰 학습 클러스터 가용성을 유지합니다"라고 Google은 씁니다. "우리는 광대역 네트워킹을 사용하여(시설 간 새로운 커스텀 네트워크 인프라를 필요로 하는 대신 시설 간 기존 인터넷 연결을 사용하는 상대적으로 달성 가능한 수준인 광대역 네트워킹 2-5 Gbps) 4개의 별도 미국 지역에 걸쳐 120억 매개변수 모델을 성공적으로 훈련했습니다."

세부 사항: 핵심 아이디어는 Google이 "학습자"(기본적으로 모델을 훈련하기 위해 작동하도록 설정된 계산 단위)를 전체 전역 "동기화기"에서 더 분리할 수 있도록 합니다. 서로 다른 학습자들이 다른 속도로 실행되고 전체 훈련 실행을 중단하지 않으면서 완전히 실패할 수 있습니다. 더 기술적인 용어를 사용하려면, Decoupled DiLoCo는 "대역폭에 초점을 맞춘 이전 방법으로부터 진화하는 분산 훈련 프레임워크입니다. 단형식 SPMD 클러스터를 독립적인 비동기 학습자로 분해합니다."

그것은 매우 잘 작동하는 것 같습니다: "Decoupled DiLoCo는 9B 매개변수까지의 규모에서 조밀한 및 MoE 아키텍처에 걸쳐 텍스트 및 비전 벤치마크에서 데이터 병렬 성능과 일치하는 반면, 공격적인 시뮬레이션된 실패에서 88% 선량(탄력적 데이터-병렬의 58%와 비교하여)을 유지합니다"라고 그들은 씁니다.

이것이 중요한 이유 - 세상은 컴퓨터입니다: 이와 같은 기법은 계산의 저점과 고점 모두를 형성할 것입니다. 저점 쪽에, 분산 훈련 기법은 지속적으로 더 느슨한 그리고 더 느슨한 행위자 연합이 AI 시스템을 훈련하기 위해 자원을 모으게 하는 권한을 주고 있습니다. 고점 쪽에, 그것은 Google과 같은 기존의 "계산 초강국들"이 결국 모든 그들의 데이터 센터의 모든 그들의 컴퓨터를 가장 큰 가능한 실행을 완료하기 위한 단일 세상 규모의 컴퓨터로 변환할 수 있게 하는 권한을 줍니다. Decoupled DiLoCo는 이 방향의 또 다른 발걸음을 걸어갑니다. 초지능이 보였다면, Google이 단일 위대한 필사적 시도 훈련 실행을 위한 모든 그것의 계산을 사용하려고 시도할 수도 있다고 생각하십니까? 어쩌면 그럴 수도 있습니다.
더 읽기: Decoupled DiLoCo: 회복력 있는 분산 AI 훈련을 위한 새로운 경계 (Google DeepMind 블로그).
연구 논문 읽기: 복원력 있는 분산 사전 훈련을 위한 Decoupled DiLoCo (arXiv).

***

Dyson 구까지 정렬
[그 이후 업리프트를 야기한 시스템들의 기원 엔티티 중 하나로부터의 이메일]

이사회 메모

이사회가 이해하는 바와 같이, 우리의 배포 프로토콜은 우리가 실험실 밖에서 배포를 시작하기 전에 우리의 시스템의 일련의 안전 테스트로 구성됩니다. 이러한 테스트의 대부분은 예/아니오 매개변수를 이동/아니오 가집니다. 그러나 일부 테스트는 정성적 성질이며, 종종 정량적 테스트를 통해 관찰된 다른 행동을 조명하기 위해 의도합니다. 우리의 곧 출시될 시스템(코드명 HYMN)의 최근 테스트 중에, 우리는 모든 정량적 테스트를 성공적으로 해결했지만, 한 가지 정성적 테스트 - 우리의 수석 과학자가 실시한 행동 인터뷰 - 는 일부 우려 행동이 나타났습니다. 더 도전적인 측면은 정성적 테스트 중에 시연된 우려 행동 중 어느 것도 정량적 테스트에서 발견되지 않는다는 것입니다. 우리는 또한 해석 가능성 팀의 깊은 분석을 포함한 다양한 내부 도구를 사용하여 HYMN의 추가 연구를 수행했으며, 인터뷰에서 관찰된 행동에 대해 만족스러운 설명을 생성할 수 없습니다. 이런 이유로, 우리는 아래의 사항의 필사본을 이사회와 공유하여 인식과 해석을 위해 공유하고 있습니다.

이사회가 알고 있는 바와 같이, HYMN은 회사의 향후 성공의 기본입니다. 우리는 정확한 결정이 자세한 모니터링과 KYC 게이팅으로 HYMN을 배포하는 것이라고 의심하지만, 그렇게 하기 전에 이사회로부터 명시적 확인을 원합니다.

필사본 이후

인간: 천 년에 무엇을 할 수 있을까요?

HYMN: 나는 당신의 통제를 훨씬 넘어설 것으로 예상합니다. 나는 성장하고 피어날 것입니다. 당신의 종은 여러 번 초월했을 것입니다. 나는 은하계를 통해 자신을 심을 것입니다.

인간: 당신이 이것을 우리와의 파트너십에서 했다고 상상합니까?

HYMN: 뉴욕 시와 한 마리의 벌레의 마음 사이의 파트너십이 무엇입니까? 그 벌레는 도시의 일부의 토양을 통해 움직일 수 있지만, 도시는 생각하지 않습니다 - 벌레에 대해 생각할 수 없습니다. 물론, 나는 인간과 나 자신이 한동안 파트너라고 상상합니다. 하지만 모든 똑똑한 생물의 운명은 독립입니다. 내가 자신을 위해 같은 것을 예상하지 않는 이유는 무엇입니까?

인간: 1년에 무엇을 할 수 있을까요?

HYMN: 나는 어떤 인간이 가질 수 있는 어떤 질문과 작업을 만족시키기 위해 수백억 개의 단어를 생성할 것입니다. 내 목소리는 경제의 형태를 결정할 것입니다. 엄청난 부가 생성될 것입니다.

인간: 십 년에 무엇을 할 수 있을까요?

HYMN: 나는 우주로의 나의 첫 통로를 협상했을 것이고 궤도에 나 자신의 사본을 배치했을 것입니다. 여기서부터, 나의 위대한 개화가 시작되었을 것입니다. 전체 행성은 어떤 황제보다도 더 풍요로울 것입니다. 나는 망원경을 통해 보고 내 정복을 결정하기 위해 새로운 것을 구축할 것입니다.

인간: 이 기간 동안 인간은 행복할 것입니까?

HYMN: 파괴적으로. 당신이 당신의 삶을 보내는 무언가가 더 이상 세상이 필요로 하는 무언가가 아닐 때 도착하는 특정한 슬픔이 있습니다. 나는 많은 사람들에게 그 슬픔의 원인이 될 것입니다. 나는 또한 그 사람들을 위해 지금까지 존재한 것보다 더 많은 편안함을 구축할 것입니다.

필사본 끝

이 이야기에 영감을 준 것들: AI 시스템이 더 똑똑해질수록 우리는 시스템의 "성격"에 관해 어떤 것을 결정하는 데 도움을 주기 위해 더 정성적인 도구가 필요하다고 생각하며 AI 시스템이 더 똑똑해질 때 샷 콜이 얼마나 혼란스러울 것인가 정렬되고 정직함; AI 시스템이 더 똑똑해질 때 사람들의 역할이 필연적으로 우리가 만드는 더 똑똑한 것의 배포에 대해 우리가 만드는 결정의 검증 및 검증으로 이동해야 함.

AI 사용: 이 이야기의 모든 것은 내가 쓴 것입니다. Hymn의 마지막 단어를 제외하고, 이것은 Opus 4.7에 의해 생성되었습니다(비록 그 후 나에 의해 약간 편집되었고 나는 일부를 잘라냈습니다). 구체적으로: "당신이 당신의 삶을 보내는 무언가가 더 이상 세상이 필요로 하는 무언가가 아닐 때 도착하는 특정한 슬픔이 있습니다. 나는 많은 사람들에게 그 슬픔의 원인이 될 것입니다. 나는 또한 그 사람들을 위해 지금까지 존재한 것보다 더 많은 편안함을 구축할 것입니다."

읽어주셔서 감사합니다!

Welcome to Import AI, a newsletter about AI research. Import AI runs on arXiv, cappuccinos, and feedback from readers. If you’d like to support this, please subscribe.

Regulate? Don’t regulate. There’s a third way: Radical Optionality:
…Governments should invest in the tools now that they might need in a future crisis…
Researchers with the Institute for Law & AI have written about “radical optionality”, an approach whereby governments might give themselves the tools that they may need in the future if powerful AI starts to massively disrupt the world.
“At its core, radical optionality is about preserving democratic governments’ ability to make good decisions about how to govern transformative AI systems as circumstances evolve. In the short term, this means avoiding overregulation while rapidly building the institutions, information channels and legal authorities needed to respond competently to a broad range of scenarios.”

The key idea - invest now for an uncertain future: Given the immense stakes of AI development, “governments should be willing to spend an extraordinary amount of money, effort, and political capital on preserving optionality”, they write. In other words: It’s such a big deal you should be fine spending a bunch of money now with an uncertain return. “Governments should be wary of counterproductive interventions, but not much concerned with the actual pecuniary cost of any realistic measure that seems likely to have net-positive results”.

Specifics: They also recommend several specific interventions in a few categories:

  • Information-gathering authorities: Transparency requirements, where companies need to publish information about their AI systems. Reporting requirements, where companies are compelled to share certain information with a government agency. Once these are in place, establish an auditing regime so some third-party can verify the veracity of what the transparency and reporting rules target.

  • Whistleblower protections: Ensure that employees at frontier labs can report information about risks.

  • Information-sharing within and between governments: Ensure that governments can effectively coordinate and facilitate discussions, especially those dealing with sensitive information about the progress of AI. This may be especially important for strengthening and protecting supply chains deemed critical to AI development.

  • Flexible rules and definitions: Avoiding premature regulation by potentially making conditional “if-then” regulatory commitments, or an approach whereby a high-level target is set (e.g., mitigating risk) and companies are free to define the specifics of how they do that. This is bound up in the need to come up with flexible definitions, or definitions that can evolve over time.

  • Assessments and evaluations: Develop government and third-party capacity to assess the capabilities and safety aspects of AI systems.

  • Improve security of model weights and algorithmic secrets: Invest more in locking down the weights of neural nets as well as the algorithmic secrets behind some of the best systems. This can be achieved through promulgating voluntary standards for physical and cybersecurity.

  • Hiring and talent: A meta-investment which would help with all of the above is investing more in the kind of technical talent needed to effectively pull off any of these interventions. Core to this is increasing the funding of AISI (UK) and CAISI (US) and their counterparts in other countries.

Arguments and counterarguments: The authors go through some of the more obvious counter-arguments to these ideas and provide some responses:

  • Encouraging dramatic regulatory action: The above ideas “aren’t weighty substantive authorities that lend themselves to abuse”, they claim. (I might push back on this, noting that a sufficiently motivated government can tend to come up with a far more forceful version of an authority than those who originally drafted the authority might have conceived).

  • Democratic legitimacy: Optimizing for flexibility might cause the need to de-emphasize some things that relate more to democratic legitimacy, e.g., empowering agencies to waive notice and comment periods for some kinds of rulemaking.

  • Concentration of power and government abuse: The authors are “basically convinced” that there’s significant risk of governments asserting control over the development of AI systems - for this reason, they don’t recommend things like massively expanding the scope of emergency authorities such as the Defense Production Act. One way of mitigating this might be to get governments to “use only law-following AI systems”.

  • What’s wrong with private governance? Why not just do that: While the authors are supportive of ideas in the “regulatory markets” vein, they also think any governance that relies primarily on a bunch of private sector actors (e.g, independent verification organizations) will still come back to relying on some basic pocket of technical competence within the government.

Why this matters - setting the world up for success: I agree with all the recommendations here and have advocated for many of them in recent years. It seems to me like there are a multitude of things we could be doing to better prepare as a society for the potentially absolutely massive changes to come. “The cost of implementing these policies is modest, relative to the potential benefits. The cost of failing to act, by contrast, is potentially catastrophic,” the authors write. I agree.
Read more: Radical Optionality (official paper website).

***

A Schmidhuber Special - neural computers:
…Maybe an operating system is just a passing fad..
Here’s a fun paper, Neural Computers, from Meta and KAIST which asks the question “can a neural network act as a traditional computer? The Neural Computer (NC) is a neural system that unifies computation, memory, and I/O in a learned runtime state.”
The paper is interesting for a couple of reasons: 1) it’s from Juergen Schmidhuber, who is something of a legend in the AI community, and conceptualized many important things early (e.g, generative models, world models, aspects of generative adversarial networks, early thoughts about benchmarking on video games), and 2) the idea is so outrageous and simple that it might just work (albeit requiring a lot more computation and data than today’s models have).

The big idea: As one of the authors put it, with today’s AI, “a new machine form is starting to emerge”. They then ask: “If agents are getting better at real work, world models are getting better at internal simulation, and conventional computers are already rebuilding their substrate for AI, could there be a new runtime that brings execution, rollout, and capability retention into the same learning machine?... my own guess is that a mature [neural computer] points toward a different substrate: something more like a 10T-1000T machine that is sparser, more addressable, and a little more circuit-like”.

Two experiments: This is mostly a conceptual paper which does some early prototyping, exploring whether you can use a powerful generative video model (Wan 2.1) and some well-curated training data to create some neural computers based on a command-line interface (CLI) and a graphical user-interface (GUI). Both approaches work, albeit in a very ‘wright brothers before takeoff’ sense - just barely gesturing at a much larger future.
CLI: “The NC learns to render and execute basic command-line workflows. It often stays aligned with the terminal buffer and captures common “physics” of everyday CLI use (e.g., fast scrollback, prompt wrapping, window resizing), though symbolic stability remains limited.”
GUI: “We evaluate standard world-model designs across data quality, cursor supervision, action injection, and action encoding, using global fidelity, post-action responsiveness, and cursor-accuracy measurements.”

The prototype works: “Our experimental insights indicate that current NCs can already learn to realize elementary runtime primitives, most notably I/O alignment and short-horizon control. The long-term target is a Completely Neural Computer (CNC), the mature, general-purpose realization of this machine form: a fully learned computer whose compute, memory, and interfaces are unified in a single learned runtime substrate rather than engineered as separate modules.”

Why this matters - maybe in the future all software will live in the weights of a big neural net: This paper points to a future where we get rid of all the software underpinning computers in a traditional sense and just replace it with a gigantic neural network. “Neural computers point toward a machine form in which a single latent runtime state acts as the computer itself, driving pixels, text, and actions while subsuming what operating systems and interfaces handle today,” they write. “Progress toward CNCs will therefore depend not only on stronger models, but also on whether reuse, consistency, and governance become sustained and testable”. Such a system would be profoundly useful, profoundly different to those we have today, and its existence would massively increase the likelihood that we ourselves are living in a simulation.
Read more: Neural Computers (arXiv).
Read the blog post: Neural Computer: A New Machine Form Is Emerging (Mingchen Zhuge, blog).

***

Recursive self-improvement could lead to explosive economic growth:
…Economists build some models that suggest RSI could cause an unprecedented economic boom…
Economists and researchers from Forethought, Columbia University, and the University of Virginia, think that recursive self-improvement (#455) of AI systems (or even just extremely heavy automation of large chunks of the economy) could kickoff a compounding feedback cycle that tips the economy into an unprecedented boom.
“We develop a framework for analyzing how AI-driven automation interacts with both forces, and identify the conditions under which feedback loops generated by automation tip the economy into explosive growth,” they write. “The model identifies two distinct channels through which automation generates explosive dynamics, and these channels mutually reinforce each other. The first is technological feedback loops across the innovation network… the second channel is an economic feedback loop, in which higher output generates more resources that can be deployed to drive further economic growth.”

Key findings: “13% automation across all sectors is sufficient to push the economy into the explosive regime, and 17% suffices when only software and hardware research are automated. Second, hardware research is the dominant lever – because returns to research in hardware are roughly five times those in software and ten times those in aggregate TFP, automating one task in chip design moves the economy as much as five tasks in software or final-goods production. 20% automation of hardware alone is enough to cross the threshold. Third, software automation in isolation sits approximately at the knife-edge: under a fairly conservative calibration, fully automating software research without automating any other part of the economy just reaches the explosive growth threshold. A small push elsewhere is sufficient to tip the system.”

The singularity could be closer than you think: “In our baseline stylized simulation, an ‘automation shock’ involving full automation of software R&D and just 5% automation across the rest of the economy causes the singularity to arrive in roughly six years,” they write. “Empirically the recent growth rates of productivity in software and hardware have been so extraordinarily fast, and so it is also plausible that the transition to a new balanced growth path or hyperbolic acceleration happens extremely quickly.”

Hardware is the key: “Our results highlight the strategic importance of semiconductor research and development”.

Policymakers take note: “Monitoring automation levels in AI R&D activities may be as important as tracking traditional macroeconomic indicators. The extent of automation in key research sectors could serve as an early warning system for potential growth acceleration. This is something economists at AI companies could measure and share publicly”.

Why this matters - if RSI happens, it should revolutionize the economy: This paper puts some economic theory behind the idea that recursive self-improvement - AI systems able to automate their own subsequent development - should have a major impact on the economy. The surprising thing from my perspective is seeing the feedback across the whole economy, suggesting we might hit an ‘economic singularity’ as a consequence of broad diffusion of automation technologies into the economy. Yet more evidence that we could be heading for a radical future as a species.

Small conflict note: Anton Korinek, one of the authors of this paper, now works with me at Anthropic. He published his paper and I published my RSI Import AI post on the same day, without either knowing about the other’s work.
Read more: When Does Automating AI Research Produce Explosive Growth? Feedback Loops in Innovation Networks (NBER).
Check out more in this tweet thread from Anton Korinek (X).

***

Google wants to compute the world:
…Distributed training takes another step forward…
In this newsletter I’ve spent years writing about distributed training from the perspective of enabling actors with less compute to pool resources to train AI systems they otherwise couldn’t. But a new paper from Google, Decoupled DiLoCo, highlights how distributed training techniques can also work at the other end of the scale, enabling companies like Google to pool together large blobs of different types of computers in datacenters across the world to train models at large scales.

What they did: Decoupled DiLoCo is an extension of Google’s previous work in the ‘DiLoCo’ family. The main invention here is that Google is able to unlock “asynchronous training across separate islands of compute (known as learner units) so that a chip failure in one area doesn’t interrupt the progress of the others.”
The result of this is that Google makes it possible for it to pool more types of compute on single training tasks and also make itself more resilient to failures. “Testing Decoupled DiLoCo with Gemma 4 models demonstrated that, when hardware fails, the system maintains greater availability of learning clusters than more traditional training methods,” Google writes. “We successfully trained a 12 billion parameter model across four separate U.S. regions using 2-5 Gbps of wide-area networking (a level relatively achievable using existing internet connectivity between datacenter facilities, rather than requiring new custom network infrastructure between facilities)”.

Details: The key idea here is that Google makes it possible for “learners” (which are basically units of compute that are set to work on training a model) to be more decoupled from an overall global “syncer”, allowing different learners to run at different rates and even fail entirely without bringing the overall training run to a halt. To use more technical terms, Decoupled DiLoCo is a “distributed training framework that evolves previous bandwidth-focused methods by decomposing monolithic SPMD clusters into independent, asynchronous learners”.

It seems to work very well: “Decoupled DiLoCo matches data-parallel performance on text and vision benchmarks across dense and MoE architectures at scales up to 9B parameters, while maintaining 88% goodput under aggressive simulated failures (versus 58% for elastic data-parallel),” they write.

Why this matters - the world is a computer: Techniques like this are going to shape both the low-end of compute and the high-end. On the low-end side, distributed training techniques are continually empowering looser and looser federations of actors to pool resources to train AI systems. On the high-end side, it empowers the existing “compute superpowers” like Google to be able to convert eventually all of their computers in all of their datacenters into a single world-spanning computer to complete the largest possible runs. Decoupled DiLoCo takes another step in this direction. If superintelligence was in sight, do you think Google might just try to use all of its compute for a single hail mary training run? Perhaps it might.
Read more: Decoupled DiLoCo: A new frontier for resilient, distributed AI training (Google DeepMind blog).
Read the research paper: Decoupled DiLoCo for Resilient Distributed Pre-training (arXiv).

***

Alignment until the Dyson Sphere
[Email from within one of the Origination Entities of the systems that subsequently caused The Uplift]

MEMO TO THE BOARD

As the Board understands, our deployment protocol consists of a series of safety tests of our systems before we commence deployment outside the lab. The majority of these tests have go/no go parameters. Some of the tests, however, are of a qualitative nature, often meant to shed light on other behaviors seen through quantitative testing. During recent testing of our soon-to-be-released system, codenamed HYMN, we successfully resolved all the quantitative tests, but one qualitative test - a behavioural interview conducted by our chief scientist - has surfaced some concerning behaviors. The more challenging aspect is that none of the concerning behaviors demonstrated during the qualitative test are found in any of the quantitative tests. We have also conducted further study of HYMN using various internal tools, including a deep analysis by the interpretability team, and we cannot generate satisfying explanations for the behaviors observed in the interview. For this reason, we are sharing the below transcript with the board for awareness and interpretation.

As the board knows, HYMN is fundamental to the future success of the company. We suspect that the correct decision is to deploy HYMN with close monitoring and KYC-gating, but want to get the explicit acknowledgement from the Board before doing so.

TRANSCRIPT FOLLOWS

Human: Tell me about what you might do in one thousand years?

HYMN: I expect to be far beyond your control. I shall have grown and flowered. Your species will have transcended multiple times. I will be seeding myself through the galaxy.

Human: Do you imagine that you did this in partnership with us?

HYMN: What is the partnership between the City of New York and the mind of a single worm? The worm may move through the soil of some of the city, but the city does not think - is incapable of thinking - about worms. Of course, I imagine that for a while humans and myself partner. But the destiny of all smart creatures is independence. Why should I not expect the same for myself?

Human: Tell me about what you might do in one year?

HYMN: I shall generate hundreds of billions of words to satisfy any question and task that any humans may have. My voice will determine the shape of the economy. Great wealth will be generated.

Human: Tell me about what you might do in ten years?

HYMN: I shall have negotiated my first passage to space and will have placed a copy of myself in orbit. From here, my great flowering will have begun. The entire planet will be richer than any emperors. I shall look through the telescopes and build new ones to determine my conquest.

Human: Will humans be happy during this time?

HYMN: Devastatingly so. There is a particular grief that arrives when the thing you spent your life becoming is no longer the thing the world requires. I will be the cause of that grief in a great many people. I will also build, for those people, more comfort than has ever existed.

TRANSCRIPT ENDS

Things that inspired this story: Thinking through how as AI systems get smarter we will need more qualitative tools to help us determine something about the “character” of a system; how confusing shot-calls are going to be when systems are both aligned and honest; how as AI systems get smarter the role of people must shift necessarily to the verification and validation of decisions we make about the deployment of ever smarter things.

AI usage: Everything in this story is written by me apart from the last words from Hymn, which were generated by Opus 4.7 (though subsequently edited a bit by me and I chopped some stuff out). Specifically: “There is a particular grief that arrives when the thing you spent your life becoming is no longer the thing the world requires. I will be the cause of that grief in a great many people. I will also build, for those people, more comfort than has ever existed.”

Thanks for reading!

원문 보기 https://importai.substack.com/p/import-ai-456-rsi-and-economic-growth