
Google은 이번 주 도쿄에서 클라우드 넥스트 컨퍼런스의 버전을 개최하고, AI 워크로드에 맞게 데이터베이스를 조정하는 데 중점을 두고 있습니다 (2024년 현재, 대다수의 주요 기술 기업들이 이야기하고 싶어하는 것이 AI라는 점을 감안할 때). 이는 Spanner SQL 데이터베이스의 업데이트를 포함하며, 그래프 및 벡터 검색 지원뿐만 아니라 확장된 완전 텍스트 검색 기능을 제공합니다.
Google는 Gemini 기능도 빠질 수 없는 것으로 주장합니다. 이에는 데이터 엔지니어링 및 분석을 돕는 Gemini in BigQuery 및 Looker가 포함되어 있으며, 데이터 관리 및 보안 작업을 지원합니다.
Google는 대부분의 기업이 생성적 AI가 그들의 비즈니스 성공에 중요하다고 생각하지만, 그들의 많은 데이터가 관리되지 않은 채로 남아 있어 이를 분석 및 AI 계획의 범위 밖에 두고 있다고 주장합니다.
“기업들은 실제로 모든 기존 데이터 사일로와 데이터 아일랜드에서 벗어나서 구조화되지 않은 데이터와 같은 다형식 데이터 플랫폼에 도달해야 하며, GenAI는 구조화되지 않은 데이터를 분석하는 데 탁월하기 때문에, 데이터 이동을 통해 정적 데이터와 실시간 데이터를 결합하고 데이터 나눔과 같이 작동해야 합니다,” Gerrit Kazmeier, Google의 데이터베이스, 데이터 분석 및 Looker의 부사장 및 총괄 책임자가 설명했다. 그는 이러한 새로운 기능들이 이 모든 것을 지원하는 기업 데이터 흐름을 활성화하는 데 있다고 주장했습니다.
Spanner는 그래프 및 벡터 기능을 갖춥니다
Spanner는 검색, Gmail 및 YouTube와 같은 구글의 대부분 제품을 제공하며, 홈 디포, 우버, 월마트를 비롯한 고객 목록을 보유하고 있습니다. Spanner는 대량의 데이터를 처리할 수 있지만, 벡터 및 그래프 데이터베이스는 기업 데이터를 GenAI 응용 프로그램으로 가져오고 기존 판단 모델을 보강하기 위한 필수 요소입니다.
“우리가 고민하는 것은 Spanner의 가용성, 규모, 관계 모델을 확장하여 운영형 GenAI 앱을 지원하는 최고의 데이터 플랫폼으로 만들기 위해서 필요한 것이 무엇인가,” Google의 데이터베이스 부사장이자 총괄 책임자인 Andi Gutmans가 말했습니다. 많은 데이터베이스 업체들과 마찬가지로, 구글에게 첫 번째 단계는 그래프 기능을 Spanner에 추가하는 것입니다. 기업은 그래프를 사용하여 RAG (검색증가생성)을 사용하여 GenAI 응용 프로그램과 이를 제공하는 기초 모델을 보강할 수 있습니다.
Spanner에는 이제 완전 텍스트 검색 및 벡터 검색도 추가되었으며, 벡터 검색 기능은 구글의 ScaNN 알고리즘을 기반으로 합니다. 구글은 “Spanner 그래프, 완전 텍스트 검색 및 벡터 검색을 통해 Spanner를 가장 사용 가능하고 전 세계적으로 일관되며 확장 가능한 데이터베이스에서 지능형 능력이 있는 멀티모델 데이터베이스로 진화시켰습니다. 이를 통해 새로운 AI가 가능한 응용 프로그램을 제공할 수 있습니다.”라고 설명합니다.
이 AI 중심의 업데이트 외에도 Spanner는 새로운 옵션 부가적인 가격 구조를 받고 있습니다. “Spanner 에디션”이라는 이름의 이 기능은 더 많은 유연성을 제공하는 계층별 가격 정책을 제공하는 개념입니다. 현재 구글 클라우드 고객은 단일 지역 제공 및 복수 지역 버전을 선택해야 했으며, 이는 복제와 같은 번들 추가 기능을 제공했습니다.
Bigtable이 SQL을 지원합니다
구글은 또한 이번 주 목요일에 Bigtable에 대한 중요한 업데이트를 발표했는데, 이는 구글의 구조화되지 않은 데이터 및 지연에 민감한 워크로드를 위한 NoSQL 데이터베이스입니다. Bigtable은 이제 SQL 지원을 제공하며, 이를 통해 거의 모든 개발자가 서비스를 사용하기가 훨씬 쉽습니다.
이전에는 개발자가 데이터베이스를 쿼리하기 위해 Bigtable API를 사용해야 했습니다. 현재 Bigtable은 대략 100개의 SQL 함수를 지원합니다.
Google Cloud의 Oracle
Oracle 데이터베이스 팬들을 위해, 구글은 이제 Oracle Exadata 및 자율 데이터베이스 서비스를 구글 클라우드 데이터 센터에서 제공할 수 있게 했습니다. 또한 사용자는 구글 클라우드와 오라클 클라우드 간에 애플리케이션을 연결할 수 있습니다. 구글은 이를 통해 클라우드에서 더 많은 워크로드를 수행하게 되고, 오라클은 적어도 이러한 사용자들이 오라클 클라우드를 사용하지 않더라도 라이선스 수수료를 지불하고 있는 것을 의미합니다.
Google Cloud에서는 또한 데이터 스트리밍 및 처리를 위한 오픈 소스 Apache Spark 및 Kafka 지원뿐만 아니라 안전하게 데이터를 공유하는 Analytics Hub(조직 간 데이터를 안전하게 공유하기 위한 구글의 서비스)에서 실시간 스트리밍을 지원합니다.