자동운전의' 입성' 이든, ChatGPT 의' 진화' 이든, 그 뒤에는 데이터와 컴퓨팅 능력에 대한 수요의 기하급수적 성장과 큰 모델에 대한 훈련이 있다. 수요면에서 지능형 컴퓨팅 센터는 자동운전의' 새로운 인프라' 로 업계에서 점점 더 언급되고 있다.
지능형 컴퓨팅 센터 (Intelligent computing center) 는 인공지능 이론에 기반한 최첨단 AI 컴퓨팅 아키텍처를 사용하여 인공지능 어플리케이션에 필요한 컴퓨팅 서비스, 데이터 서비스 및 알고리즘 서비스를 제공하는 새로운 컴퓨팅 인프라입니다. 즉, 지능형 컴퓨팅 센터는 실제로 컴퓨팅 전원 및 프로덕션 플랫폼입니다. 그렇다면 왜' 자동보조운전' 을' 자동운전' 으로 바꿀 수 있을까요?
항복' 자동운전 한계 비용 자동운전 스마트컴퓨팅 센터' 클라우드 전용'
어떤 사람들은 지능형 컴퓨팅 센터가 자동 운전 개발의 부스터라고 말합니다. 자동 운전 알고리즘 모델의 훈련은 기계 학습의 전형적인 시나리오 중 하나이며, 그 시각 검사, 궤적 예측, 운전 계획 등 알고리즘 모델은 동시에 높은 동시 병렬 계산을 완료해야 하며, 컴퓨팅 능력에 대한 수요가 높고, 지능형 컴퓨팅은 알고리즘 모델의 성숙도를 높이기 위해 엄청난 컴퓨팅 능력을 제공합니다.
자동운전 분야에서는 지능형 컴퓨팅 센터를 언급할 때 먼저 테슬라를 언급해야 한다. 20 17, 변압기 네트워크가 등장한 후 대형 모델 분야의 메인스트림 알고리즘 아키텍처의 기반을 마련했습니다. 그런 다음 2020 년에 테슬라는 AI 모델을 자동 운전에 적용하기 시작한 자동 운전 분야에 변압기 모델을 도입했습니다. 이후 테슬라는 자신의 AI 컴퓨팅 센터인 ——Dojo 를 만들기 시작했고, 총14 만 개의 영위다 GPU 를 사용하여 AI 모델을 훈련시켰다. 효율성을 더욱 높이기 위해 테슬라는 202 1 에서 자체 개발한 AI 가속 칩 D 1 을 발표하고 25 개의 d 1 을 함께 캡슐화하여 훈련 기와를 만든 다음 Dojo ExaPOD 를 형성할 계획이다. 최신 버전의 테슬라 AI DAY 에서 머스크 (WHO) 에 따르면 테슬라 수퍼컴퓨팅 장치 ExaPOD 는 2023 년 1 분기에 배치될 예정입니다.
국내 측은 2022 년 8 월, Xpeng Motors 와 아리운은 당시 국내 최대 자동운전 지능형 컴퓨팅 센터를 공동 설립하여 자동운전 모델 훈련을 전문으로 하고, 컴퓨팅 능력이 600PFLOPS 에 달하며 초당 60 억 회의 부동 소수점 연산을 완료하는 것과 같다. 그러나, 이 기록은 단지 4 개월 남짓 유지되었다.
5438 년 6 월+올해 10 월 밀리 지행은 화산엔진과 공동으로 자동운전업계 최대 스마트 컴퓨팅센터 마나오스 (설호 오아시스) 를 출범시켜 초당 67 억회의 부동 소수점 연산, 초당 2T 스토리지 대역폭, 초당 800G 통신 대역폭을 선보였다. 길리는 또한 65438 년 6 월 28 일 길리 스타 스마트 컴퓨팅 센터를 선보였다. 현재 스마트 운전과 자동차 네트워킹 실험 데이터가 거의 100 PB 에 접근하여 온라인 차량 동시 컴퓨팅 지원이 백만 명에 이른다.
현재 상황에서 비용과 수요의 두 가지 요소는 지능형 컴퓨팅 센터의 매력입니다.
비용 수준에서 컴퓨팅 능력은 자동 운전의 기본 요소로서 교육, 마크업 등을 완료하기 위해 더 높은 성능의 지능형 컴퓨팅 센터가 필요합니다. MANA OASIS 의 경우 Lego 고성능 산자 라이브러리, ByteCCL 통신 최적화 기능 및 대형 모델 교육 프레임워크를 배포하여 컴퓨팅 성능을 극대화합니다. 스파 스 MoE 를 기반으로, 크로스 머신 * * * 공유를 통해 수천억 매개 변수에 대한 대규모 모델 교육을 쉽게 완료할 수 있으며, 백만 클립 (밀리미터 비디오 최소 표시 단위) 교육 비용은 100 카드 주만, 교육 비용 절감1;
효율적이고 저렴한 데이터 인텔리전스 시스템을 구축하는 것은 자동 운전 기술의 건강한 발전의 기초이며, 자동 운전 시스템의 지속적인 반복 진보의 중요한 부분이자 자동 운전 폐쇄 루프 상용화의 관건이다.
Xpeng Motors 회장은 "이런 방식 (스마트 컴퓨팅 센터) 을 통해 컴퓨팅 능력을 미리 비축하지 않으면 향후 5 년 동안 기업의 컴퓨팅 능력 비용이 수억에서 수십억으로 증가할 것" 이라고 말했다.
공용 클라우드 서비스를 계속 사용할 경우 한계 비용 상승은 한 가지 측면일 뿐입니다. 더 중요한 것은 지능형 컴퓨팅 센터를 통해 자동 조종 기업이 "사설 클라우드" 를 구현할 수 있다는 것입니다. 자동 운전 개발에는 데이터 수집, 데이터 필터링, 마킹, 모델 교육, 재생 검증, 시뮬레이션 테스트 등이 포함됩니다. 클라우드 컴퓨팅의 본질은 컴퓨팅 장비를 임대하는 것이고, 클라우드 서비스 업체의 설비는 모두 통일적으로 구매하는 것이다. 더 많은 고객을 확보하기 위해서, 이 설비들은 매우 큰 공통성을 가지고 있다. 장비 내부에서 사용되는 CPU, GPU/AI 가속기, 메모리 모델 및 사양은 모두 고정되어 있어 자동차 회사, 자동운전 회사의 알고리즘과 가장 잘 어울리기 어렵다. 또한 클라우드 서비스 공급업체는 자동 운전 알고리즘에 대한 이해가 높지 않아 컴퓨팅 용량 스케줄링의 손실과 비효율적인 문제를 초래할 수밖에 없습니다. 따라서 수요 관점에서 볼 때, 지능형 컴퓨팅 센터는 자동운전과 자동차 기업의 신격기가 될 수 있는 것 같습니다.
밀리를 예로 들자면, MANA OASIS 의 가봉으로 밀리 MANA 의 다섯 가지 차종이 업그레이드되고, 차측 인식 구조가 세대 간 업그레이드된다. 밀리 기술 스택의 레이아웃은 계속해서 완전하고 앞선 태세를 유지하고 있으며, 특히 인식과 인지 방면에서 업계를 선도하며 큰 모델, 큰 계산력, 큰 데이터의 발전 방향을 이끌고 자동 운전 3.0 시대로 돌진하고 있다.
데이터 수집, 필터링 및 태깅 측면에서 자동 운전 시스템은 개발 초기에 대량의 도로 환경 데이터를 수집하여 차량이 인간 운전자처럼 차선, 보행자, 장애물 등의 주행 환경에서 중요한 정보를 빠르고 정확하게 식별할 수 있도록 해야 합니다. 유일한 방법은 대량의 데이터를 바탕으로 반복적인 훈련과 검증을 통해 도로 환경에 대한 차량의 인식 수준이 점차 실제 장면에 가까워지도록 하는 것이다. 이 과정에서 판단의 정확성을 지속적으로 높인다.
또한 자동차 업체에서 수집한 데이터는 모델 교육이 필요하며, 알고리즘은 데이터 조작을 통해 모델을 생성합니다. 지능형 컴퓨팅 센터는 대형 모델과 대량 데이터 교육을 구동하는 가속기가 될 것입니다. 스파스 MoE 를 기반으로 계산 특성에 따라 스파스 활성화, 컴퓨팅 효율성 향상, 독립 실행형이 수백 억 매개 변수를 훈련시킬 수 있는 대형 모델의 효과 실현, 여러 기계에 걸쳐 exper 을 즐길 수 있는 방법 실현, 수천억 매개 변수를 갖춘 대형 모델의 교육 완료, 교육 비용을 주간 100 카드 수준으로 낮춥니다. 밀리미터는 그림, 점 구름, 구조화된 텍스트 등의 멀티 모달 정보를 동시에 처리할 수 있는 업계 최고의 멀티 태스킹 병렬 교육 시스템을 설계하고 구현하여 모델의 희소성을 보장하고 컴퓨팅 효율성을 높입니다. 법력 오아시스 훈련 효율 향상 100 배.
Mimo 지행 CEO 구 하오 웨이 (Guo Haowei) 도 지능형 컴퓨팅 센터 구축의 기본 논리를 상세히 설명했다. "자동 운전의 지능형 컴퓨팅 센터에 대한 첫 번째 요구 사항은 분명히 컴퓨팅 능력이다. 스마트 컴퓨팅 센터의 수퍼컴퓨팅 능력은 이 무술 분야에서 얼마나 많은 AI 엔지니어가 큰 모델을 만들 수 있는지, 얼마나 많은 큰 모델을 개발할 수 있는지를 나타낸다. "
스마트 보조 운전 MANA OASIS 는 어떤 문제를 해결하는 데 도움이 되었습니까?
현재 많은 자동차 기업과 자동운전 기술회사들이 이미 지능형 컴퓨팅 센터를 건설하여 다음 단계의 경쟁으로 삼고 있다. 지난 5438 년 6 월+10 월 머하우 AI 일, 장카이 머하우지행 회장은 2023 년 자동운전업계 트렌드에 대한 10 대 신규 예측을 내놓았고, 슈퍼컴퓨팅 센터가 그 중 1 위에 올랐다. "하이퍼컴퓨팅 센터는 자동운전 기업의 입문 구성이 될 것이다."
사실, 현재 신에너지 자동차 브랜드가 일반적으로 고속도로 장면 아래의 보조운전이 표준으로 등재됨에 따라 경기장은 이미 고속도로에서 도시로 유유히 바뀌었다. (윌리엄 셰익스피어, Northern Exposure (미국 TV 드라마), 스포츠명언) 고속 항법 보조 운전에 비해 도시 운전은 신호등, 교차로, 행인 전동차, 폐색, 고정 장애물, 잦은 브레이크, 시동 등 일련의 문제를 다루며 복잡성이 몇 단계 증가했다.
실측 차량으로만 이런 코너 사례에 도전한다면 비용, 안전, 시간이 모두 기업 발전의 장벽이 될 것이다. 따라서 가상 시뮬레이션은 일부 비용과 장면 다양성을 해결하는 열쇠가 됩니다. 이 가운데 대규모 롱테일 시나리오에는 데이터 센터의 충분한 컴퓨팅 지원이 필요합니다. 동시에, 시뮬레이션 장면이 현실로 돌아오는 과정에도 지원을 제공하기 위해 엄청난 컴퓨팅 능력이 필요합니다.
MANA OASIS 의 증설로 데이터 정보 시스템 MANA 의 5 개 모델이 모두 업그레이드되었다. 5 개 모델의 도움으로 MANA 의 최신 차량 측 인식 아키텍처는 과거에 분산되어 있던 여러 다운스트림 작업에서 통합되어 일반 장애물 식별, 로컬 도로 네트워크, 동작 예측 등의 작업을 포함한 보다 포괄적인 아키텍처를 형성합니다. 차량 측 인식 아키텍처는 세대 간 업그레이드되었습니다. 이는 밀리가 더 강한 인식력과 더 강한 제품력을 가지고 있어 무인운전으로 빠르게 전진하고 있다는 의미이기도 하다.
첫 번째는 시각적 자체 모니터링 모델로 밀리가 국내에서 4D 세그먼트의 자동 치수를 최초로 실현한 것이다. 밀리미터는 비디오 자체 모니터링을 통해 대량의 비디오 클립을 사용하여 대형 모델을 미리 교육하고, 소량의 수동 치수 세그먼트 데이터를 사용하여 훈련 감지 추적 모델을 미세 조정하여 모델을 자동 치수화할 수 있도록 합니다. 그런 다음 단일 프레임 데이터에 해당하는 원본 비디오를 추출하여 세그먼트로 구성합니다. 여기서 10% 는 치수기입된 프레임이고 90% 는 치수기입되지 않은 프레임입니다. 그런 다음 이러한 세그먼트를 모델에 입력하고 90% 치수기입되지 않은 프레임의 자동 치수를 완료하여 모든 단일 프레임 치수를/kloc-로 자동 변환합니다. 밀리미터 웨이브 비디오 자체 모니터링 모델은 매우 어려운 일부 장면에서도 심각한 차폐의 자전거 타는 사람, 먼 곳의 작은 목표, 악천후, 조명 등과 같은 우수한 일반화 효과를 제공합니다. 자동 치수기입을 정확하게 수행할 수 있습니다.
둘째, 큰 모델의 3D 재구성은 데이터 생성에 도움이 되며, 저렴한 비용으로 데이터 배포 문제를 해결하고 인식을 높입니다. 실제 데이터에서 구석 사례를 완전히 축적하는 것은 어렵고 비용이 많이 드는 업계 과제에 직면하여 Millicent 는 NeRF 기술을 자동 운전 장면 재구성 및 데이터 생성에 적용했습니다. 시야각, 조명 및 텍스처 재질을 변경하여 매우 사실적인 데이터를 생성하고, 일반 사례에 대한 저비용 획득을 실현하며, 다양한 고비용 코너 사례를 생성합니다. 대형 모델 3D 재구성으로 생성된 데이터는 기존의 인공 명시적 모델링 및 렌더링 텍스처 방법보다 우수하며 비용도 저렴합니다. NeRF 생성 데이터를 늘리면 인식 오류율이 30% 이상 낮아지고 데이터 생성 전 과정이 자동화되며 수작업이 필요하지 않습니다.
멀티 모달 상호 감독 대형 모델은 일반 장애물 식별을 완료할 수 있습니다. 차선선과 일반적인 장애물을 정확하게 탐지한 후, Millie 는 도시의 다양한 이형 장애물을 안정적으로 감지할 수 있는 보다 일반적인 해결책을 생각하고 탐구하고 있습니다. 현재 밀리미터의 멀티 모드 상호 감시 모델은 레이저 레이더를 시각적 규제 신호로 도입하여 비디오 데이터를 직접 사용하여 장면의 대략적인 구조 표현을 추론하고 있습니다. 이런 범용 구조의 탐지는 기존의 의미장애 탐지를 잘 보완하고 복잡한 도시 조건 하에서 자동운전 시스템의 통과율을 높이는 데 효과적이다.
동적 환경의 큰 모형은 도로의 위상 관계를 정확하게 예측하여 차량이 항상 올바른 차선에 유지되도록 합니다. 리센싱 기술의 노선에서 고정밀 지도에 대한 의존도를 최소화하기 위해 밀리는' 도로 토폴로지 실시간 추론' 의 도전에 직면해 있다. 따라서 BEV 의 특징지도를 기준으로 표준 지도를 지침으로 하고, 자동 회귀 코덱 네트워크를 활용하여 BEV 피쳐를 구조화된 위상 점 시퀀스로 디코딩하여 차선 위상 예측을 달성합니다. 표준 지도의 탐색 프롬프트에서, 밀리미터의 인식 능력을 인간처럼 도로 토폴로지의 실시간 추론을 가능하게 한다. (존 F. 케네디, Northern Exposure (미국 TV 드라마), 표준명언)
나는 교차로 문제를 해결하면 사실 대부분의 도시의 NOH 문제를 해결했다고 생각한다. 현재 보정과 베이징에서 85% 의 길목 토폴로지 추정 정확도가 95% 에 달한다. 매우 복잡하고 불규칙한 길목조차도 정확하게 예측할 수 있고, 노기사보다 나이가 많다.
인간 운전의 자기감시 인식 모델은 지난 2 월 공식적으로 DriveGPT 로 업그레이드되었으며, 이는 세계 최초의 자동운전 인식 모델이기도 하다. 운전 전략을보다 의인화, 안전 및 유창하게 만들 수 있습니다. 현재 밀리미터 웨이브 드라이브 GPT 는 모델 구축 및 1 단계 데이터 실행을 완료했으며 매개변수 규모는 GPT-2 표준에 달할 수 있습니다. 다음으로, DriveGPT 는 대규모 실제 인수 데이터를 계속 도입하여 인간 운전 데이터 피드백에 대한 집중 학습을 통해 평가 효과를 지속적으로 향상시킬 것입니다. 한편, DriveGPT 는 클라우드 평가 모델로 차량 끝에서 작은 차종의 운전 효과를 평가할 예정이다.
시뮬레이션 실험은 기술 및 제품 개발 주기를 효과적으로 단축하고 R&D 비용을 절감할 수 있습니다. 업계의 전형적인 롱테일 장면은 풍부하지 않으며, 시뮬레이션 플랫폼을 사용하면 현실에서 만날 수 있는 극단적인 장면을 쉽게 생성할 수 있습니다. 시뮬레이션 테스트의 시뮬레이션 환경은 센서 모듈의 복잡성을 지원하기 위해 다중 모드 융합을 구현해야 하므로 큰 컴퓨팅 능력 지원도 필요합니다.
세부 사항 외에도 테슬라 슈퍼컴퓨팅 센터는 거의 2 만 개의 GPU 를 보유하고 있어 자동운전 훈련의 효율성에 즉각적인 효과를 발휘하고 자동운전 시스템의 개발 효율을 극대화한다. 대륙그룹의 높은 컴퓨팅 능력 클러스터는 개발 주기를 몇 주에서 몇 시간으로 단축하여 자동운전이 중장기 상업 계획에서 시행될 수 있도록 합니다. 기계 학습 시간의 단축은 신기술이 시장에 진입하는 속도를 가속화했다. 붕붕자가 핵심 차형 훈련 시간을 7 일에서 1 시간으로 단축하여 속도가 거의 1.70 배 크게 빨라졌다 ...
현재, 자동운전 분야에 장기 계획이 있는 자동차 기업, 자동차 신세력, 전통 브랜드, 기술 공급상들이 모두 자신의 슈퍼컴퓨팅 센터를 건설하고 안정적인 컴퓨팅 자원을 확보하며 개발주기를 단축하고 자동운전 제품 출시 속도를 가속화하는 것은 의심할 여지가 없는 사실이다. 반면 슈퍼컴퓨팅 센터가 없다면 자동운전 훈련 속도가 현저히 느려지고 자동운전업체 간 격차가 더욱 두드러질 것으로 보인다.
지능형 컴퓨팅 센터로 데이터 해자 디지털 새 인프라를 구축하는 것이 점차 발전 표준이 되고 있다.
자동운전이 발전한 이래 업계는 버스 지능 보조운전이 대규모로 펼쳐질 가능성이 가장 높은 상업 장면이라는 사실을 발견했다. 고급공학지능자동차연구원에 따르면 2022 년 중국 시장 (수출입 제외) 승용차 L2 급 보조운전 표준적재율은 2 개월 연속 30% 를 넘어섰다. 지연컨설팅에 따르면 2025 년까지 전 세계 신차 L2 자동운전 침투율은 53.99% 에 이를 것으로 예상된다.
올해 도시 항법 보조 운전도 양산 여행을 시작했다. 서부증권은 2023-2025 년 국내 시장에 70 만대,10/0.69 만대, 348 만대 자동차, 도시항법보조운전, 각각 17%, 40% 를 차지할 것으로 전망했다
도시 항법 보조 운전이 가속화되는 배경에서 복제와 확장이 용이한 재인식 방안이 더 많은 관심을 받고 있다. 리센싱 기술 노선에서' 도로 토폴로지 실시간 추론' 의 과제에 직면하여, 선택은 특징지도를 기반으로 표준 지도를 가이드로 하고, 자동 회귀 코덱 네트워크를 사용하며, 구조적 위상 점 시퀀스 디코딩을 통해 차선 위상 예측을 가능하게 합니다. 업계가 점차 * * * * 지식의 재인식 경로를 달성했으며 고정밀 지도 솔루션보다 컴퓨팅 능력에 더 의존하고 있다는 것을 쉽게 알 수 있습니다.
인공지능은 혁신적인 가속기로, 지능형 컴퓨팅 센터는 다양한 기술 혁신을 지원할 수 있습니다. 지능형 컴퓨팅 센터는 안전하고 신뢰할 수 있으며 재사용 가능한 기술 연구 개발 환경 구축을 위한 컴퓨팅 시설을 제공하고, 각 분야의 과학 연구 개발을 위한 지능형 컴퓨팅 서비스를 제공하고, 과학 연구 개발 프로세스를 가속화할 수 있습니다. 한편, 지능형 컴퓨팅 센터는 차세대 정보 기술의 종합 응용 수단이다. 지능형 컴퓨팅 센터의 신속한 구축, 보급 및 대규모 애플리케이션은 통신 서비스 네트워크, 대용량 데이터, 인공 지능 등의 기술을 신속하게 반복하여 기술 혁신을 추진할 것입니다. 자동운전 데이터는 조각화되어 있으며, 수많은 작은 서류가 특징이며, 수백 억에 달하며, 훈련에는 교환할 데이터가 많이 있습니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 스포츠명언) 지능형 컴퓨팅 센터는 자동 운전 모델에 더 나은 병렬 컴퓨팅 프레임워크를 제공하여 교육 시 하드웨어 자원을 최대한 활용할 수 있는 충분한 대역폭을 제공합니다.
2020 년 4 월 20 일 국가발전개혁위원회는 처음으로 지능형 컴퓨팅 센터를 대표하는 컴퓨팅 인프라를 포함한 새로운 인프라의 범위를 분명히 했다. 2023 년 6 월 65438+ 10 월 10, 국가공업정보안전개발연구센터에서' 지능계산센터 2.0 미래보고서' 를 발표해 5 년여의 발전을 거쳐 스마트컴퓨팅센터가/KLOC-0 에서
관련 통계 및 계산에 따르면 현재 중국의 30 여 개 도시가 지능형 컴퓨팅 센터를 건설하거나 건설 중이며 향후 5 년간 중국의 지능형 컴퓨팅 능력의 연간 복합 성장률은 52.3% 에 이를 것으로 전망된다. 지능형 컴퓨팅 센터의 혁신적인 발전은 인공지능의' 컴퓨팅 기반' 을 더욱 공고히 하여 인공지능 및 관련 산업의 빠른 발전을 촉진하는 새로운 엔진이 될 것이다.
"지능형 컴퓨팅 센터의 비용 최적화는 놀라울 정도로 억 위안 수준에 이를 것으로 예상됩니다." 장카이가 올해 65438+ 10 월에 한 예측입니다. 현재와 미래에 계획된 양산 규모로 볼 때 자체 지능형 컴퓨팅 센터를 구축하면 막대한 비용을 절감할 수 있습니다. 동시에, 그것의 효율성 향상도 매우 두드러진다.
인공지능의 급속한 발전과 새로운 알고리즘의 출현으로 가능한 한 빨리 새로운 기술과 모델을 도입해야 한다. 동시에, 데이터는 지능화 발전의 가장 큰 원동력이며, 대량의 비용 성분을 차지하고 있다. 자체 구축 된 지능형 컴퓨팅 센터를 사용하여 데이터 해자를 구축하면 산업 지능형 생태계를 개선 할 수있을뿐만 아니라 기업이 지능에서 선제 적 이점을 얻을 수 있습니다. 지능형 컴퓨팅 센터는 새로운 디지털 인프라로서 미래의 자동 운전 기술의 지속적인 반복 업그레이드를 이끌어야 합니다.
이 글은 이차 좋은 작가의 자동차 업계의 시야에서 나온 것으로, 저작권은 저자가 소유한다. 어떤 형태로든 저자에게 연락하십시오. 내용은 대표작자의 관점일 뿐 차 개조와는 무관하다.