menu
close

추론 기반 AI 모델, 기본 모델보다 탄소 배출 50배 더 많아

호흐슐레 뮌헨 대학 연구진의 획기적인 연구에 따르면, 고도 추론 능력을 갖춘 AI 모델이 동일한 질문에 답할 때 단순한 모델보다 최대 50배 더 많은 이산화탄소(CO2)를 배출하는 것으로 나타났다. 이 연구는 14종의 대형 언어 모델(LLM)을 평가해 정확도와 환경 영향 간의 명확한 상충관계를 밝혀냈다. 사용자는 적절한 모델 선택과 간결한 답변 요청을 통해 AI의 탄소 발자국을 크게 줄일 수 있다.
추론 기반 AI 모델, 기본 모델보다 탄소 배출 50배 더 많아

연구진은 점점 더 정교해지는 AI 시스템에 대한 의존도가 높아짐에 따라 상당한 환경 비용이 발생하고 있음을 밝혀냈다. 2025년 6월 19일, Frontiers in Communication에 발표된 새로운 연구에 따르면, 추론 기능이 탑재된 AI 모델은 동일한 질문에 답할 때 단순 모델보다 최대 50배 더 많은 이산화탄소를 배출할 수 있다.

호흐슐레 뮌헨 응용과학대학의 막시밀리안 다우너(Maximilian Dauner)가 이끄는 연구팀은 70억에서 720억 개의 파라미터를 가진 14종의 대형 언어 모델(LLM)을 평가했다. 이들은 수학, 역사, 철학, 추상대수 등 다양한 분야의 1,000개 벤치마크 질문을 통해 모델을 테스트했다.

연구 결과, 추론 모델은 질문당 평균 543.5개의 '생각 토큰(thinking tokens)'을 생성한 반면, 간결한 모델은 37.7개에 불과했다. 이러한 추가 연산 단계는 에너지 소비와 탄소 배출 증가로 직결된다. 테스트된 모델 중 가장 정확도가 높았던 것은 700억 파라미터의 추론 기반 Cogito 모델로, 84.9%의 정확도를 기록했지만, 비슷한 크기의 간결 답변 모델보다 3배 더 많은 CO2를 배출했다.

"현재 LLM 기술에는 정확도와 지속가능성 간의 명확한 상충관계가 존재합니다."라고 다우너는 설명했다. "CO2 배출량이 500g 이내로 유지된 모델 중 80% 이상의 정확도를 달성한 경우는 없었습니다."

질문의 주제 역시 배출량에 큰 영향을 미쳤다. 추상대수나 철학처럼 복잡한 추론이 필요한 질문은 고등학교 역사 등 단순한 주제보다 최대 6배 더 많은 배출량을 유발했다.

연구진은 사용자가 신중한 선택을 통해 AI의 탄소 발자국을 통제할 수 있다고 강조했다. 예를 들어, DeepSeek의 R1 모델(700억 파라미터)로 60만 개의 질문에 답하면 런던-뉴욕 왕복 항공편과 맞먹는 CO2가 배출된다. 반면, 알리바바의 Qwen 2.5 모델(720억 파라미터)은 비슷한 정확도로 약 190만 개의 질문에 답하면서 동일한 배출량을 기록할 수 있다.

"사용자가 AI가 생성한 출력물의 정확한 CO2 비용을 알게 된다면, 언제 어떻게 이 기술을 사용할지 더 신중하게 선택할 수 있을 것입니다."라고 다우너는 결론지었다. 연구진은 이 연구가 AI가 일상에 점점 더 깊이 자리 잡는 가운데, 보다 정보에 기반한 환경 친화적 AI 활용을 촉진하길 기대하고 있다.

Source:

Latest News