Root Nation소식IT 뉴스Meta의 음성 AI는 4개 이상의 음성 언어를 인식합니다.

Meta의 음성 AI는 4개 이상의 음성 언어를 인식합니다.

-

메타 ChatGPT 클론이 아닌 AI 언어 모델을 만들었습니다. 이 회사의 MMS(Massively Multilingual Speech) 프로젝트는 4개 이상의 음성 언어를 인식하고 000개 이상의 언어로 음성을 재현(텍스트 음성 변환)할 수 있습니다. 공개적으로 발표된 대부분의 AI 프로젝트와 마찬가지로 Meta는 오늘날 언어 다양성을 보존하고 연구자들이 이를 개발하도록 장려하기 위해 MMS를 공개 액세스로 만듭니다. "오늘 우리는 모델과 코드를 공개적으로 공유하여 연구 커뮤니티의 다른 구성원이 우리 작업을 기반으로 할 수 있도록 합니다."라고 회사는 밝혔습니다. "이 작업 덕분에 우리는 세계의 놀라운 언어 다양성 보존에 작은 기여를 할 수 있기를 바랍니다."

메타

음성 인식 및 텍스트 음성 변환 모델에는 일반적으로 전사 레이블이 포함된 수천 시간의 오디오 녹음에 대한 교육이 필요합니다. 그러나 산업화된 국가에서 널리 사용되지 않는 언어의 경우(대부분이 향후 수십 년 동안 멸종 위기에 처해 있음) "이 데이터는 존재하지 않습니다."라고 Meta는 말합니다.

Meta는 오디오 데이터 수집에 색다른 접근 방식을 취했습니다. 즉, 번역된 종교 문서의 오디오 녹음을 듣는 것입니다. 회사 측은 "우리는 성경과 같이 다양한 언어로 번역되고 텍스트 기반 번역 연구를 위해 번역이 광범위하게 연구된 종교 문서로 눈을 돌렸다"고 말했다. "이 번역에는 다른 언어로 이 텍스트를 읽는 사람들의 오디오 녹음이 공개되어 있습니다." 성경 및 유사 텍스트에서 표시되지 않은 항목을 포함함으로써 Meta 연구원은 모델에서 사용할 수 있는 언어의 수를 4개 이상으로 늘렸습니다.

"오디오 녹음 내용이 종교적이지만 우리의 분석에 따르면 이것이 모델의 더 종교적인 연설에 영향을 미치지 않는 것으로 나타났습니다."라고 Meta는 썼습니다. "우리는 음성 인식을 위한 대규모 언어 모델(LLM) 또는 시퀀스 모델에 비해 훨씬 더 제한적인 연결주의 시간 분류(CTC) 접근 방식을 사용하기 때문이라고 생각합니다." 또한 대부분의 종교 서적을 남성이 읽었음에도 불구하고 이것이 남성 편견으로 이어지지는 않았습니다. 시스템은 여성과 남성의 목소리를 동등하게 잘 인식했습니다.

데이터를 더 유용하게 만들기 위해 정렬 모델을 교육한 후 Meta는 레이블이 지정되지 않은 데이터에서 학습할 수 있는 회사의 "자체 감독 언어 표현 학습" 모델인 wav2vec 2.0을 사용했습니다. 비전통적인 데이터 소스와 자기 주도적 음성 모델의 조합은 인상적인 결과를 가져왔습니다. "우리의 결과는 대량 다국어 방송 모델이 기존 모델에 비해 성능이 좋고 10배 더 많은 언어를 커버한다는 것을 보여줍니다." 특히 Meta는 MMS를 OpenAI의 Whisper와 비교했는데 기대 이상의 결과가 나왔다. "Massively Multilingual Speech 데이터로 훈련된 모델의 단어 오류 비율은 절반이지만 Massively Multilingual Speech는 11배 더 많은 언어를 처리합니다."

Meta는 새 모델이 완벽하지 않다고 경고합니다. 예를 들어 음성-텍스트 모델이 개별 단어나 구를 잘못 번역할 수 있는 위험이 있습니다. “결과에 따라 공격적이거나 부정확한 언어로 이어질 수 있습니다. 우리는 AI 커뮤니티 내 협업이 AI 기술의 책임 있는 개발에 중요하다고 계속 믿고 있습니다.”

메타

이제 Meta는 오픈 소스 연구를 위한 MMS를 출시했기 때문에 전 세계 언어의 수를 100개 이하로 줄이는 추세를 역전시키고자 합니다. 대부분 주요 기술이 지원합니다. 그녀는 보조 기술, TTS, 심지어 VR/AR 기술을 통해 모든 사람이 모국어로 말하고 배울 수 있는 세상을 봅니다. "우리는 사람들이 모국어로 말하면서 정보에 접근하고 기술을 사용할 수 있기 때문에 사람들이 언어를 생생하게 유지하도록 격려하는 기술이 정반대의 영향을 미치는 세상을 상상합니다."

또한 읽으십시오:

근원Engadget
가입하기
에 대해 알림
손님

0 코멘트
임베디드 리뷰
모든 댓글 보기