Qdrant, um fornecedor de soluções de pesquisa vetorial e banco de dados combináveis, lançou desempenho de indexação atualizado, mecanismos de failover de cluster de zona tripla e recursos de registro de auditoria com foco em conformidade.
A empresa desenvolve um banco de dados vetorial independente para armazenar embeddings exigidos por grandes modelos de linguagem (LLMs) e agentes autônomos de IA, que normalmente alimentam fluxos de trabalho de inferência de IA, como Retrieval-Augmented Generation (RAG). De acordo com Qdrant, as equipes de compras empresariais sempre avaliam as ferramentas de busca de vetores em relação a três critérios principais: escalabilidade para cargas de trabalho crescentes, continuidade de serviço em meio a falhas de infraestrutura e auditoria operacional rastreável.
André Zayarni, cofundador e CEO da Qdrant, comentou: "As GPUs não estão mais limitadas à inferência de modelos; elas também otimizam a indexação de dados. Habilitamos a construção de HNSW acelerada por GPU em nossa versão de código aberto desde a versão 1.13, e esse recurso agora está oficialmente disponível no Qdrant Cloud. Combinado com replicação multi-AZ e registro de auditoria, o pacote integrado capacita as empresas para implantar Qdrant para cargas de trabalho de produção críticas".
As últimas atualizações de produtos da Qdrant abrangem três melhorias principais:
Indexação acelerada por GPU: Testes de benchmark confirmam que GPUs dedicadas aumentam a velocidade de construção do índice HNSW em até quatro vezes no Qdrant Cloud. Os usuários podem montar recursos de GPU em clusters existentes para lidar com rajadas de indexação de alta intensidade com eficiência.
Clusters de zona de multidisponibilidade (AZ): o mecanismo de replicação cross-AZ duplica dados em três zonas de disponibilidade em uma única região. Ele elimina a latência de failover manual, garantindo operações de leitura e gravação ininterruptas, mesmo se uma zona de disponibilidade sofrer uma interrupção.
Registro de auditoria: a função registra todas as operações baseadas em API, incluindo consultas de dados, upserts, exclusões, gerenciamento de coleção e tarefas de snapshot. Cada entrada de log adota o formato JSON estruturado, marcando identidades de usuários, chaves de API, carimbos de data/hora, coleções de destino e status de autorização de operação. Quando sistemas autônomos executam tarefas com base nos dados recuperados, os logs fornecem trilhas de auditoria claras para fontes de solicitação, tempo de execução e legitimidade de acesso. Os usuários podem personalizar ciclos de retenção de logs e exportar registros externamente por meio de APIs para arquivamento de longo prazo.
Atualmente, a indexação acelerada por GPU está acessível na AWS, com planos contínuos para expandir a cobertura para mais fornecedores e regiões de nuvem. Os clusters Multi-AZ pertencem ao nível Premium da Qdrant, oferecendo um tempo de atividade apoiado por SLA de 99,95%. O recurso de registro de auditoria está aberto a todos os clusters pagos do Qdrant Cloud.
A documentação oficial fornece mais detalhes sobre os três novos recursos.
Nota de rodapé
Hierarchical Navigable Small World (HNSW) é um algoritmo projetado para identificar vetores vizinhos mais próximos. Ele mapeia vetores em estruturas gráficas interconectadas, que se expandem drasticamente com o aumento do volume de dados. O HNSW empilha múltiplas camadas de gráficos virtuais: a camada esparsa superior contém vetores mínimos para uma pesquisa preliminar rápida, enquanto as camadas inferiores armazenam cada vez mais vetores até que a camada inferior cubra todos os pontos de dados. Cada camada atua como um ponto de entrada otimizado para a próxima, reduzindo bastante a latência geral da pesquisa.
A Qdrant enfrenta a concorrência de vários pares do setor. A Pinecone também adota algoritmos HNSW e aproveita GPUs NVIDIA para otimizar o desempenho de incorporação e reclassificação. Zilliz oferece compatibilidade HNSW e aceleração de GPU; seu banco de dados Milvus subjacente integra Nvidia CUDA-Accelerated Graph Index for Vector Retrieval (CAGRA) da biblioteca RAPIDS cuVS para permitir a indexação de GPU.
Pequim Qianxing Jietong Technology Co., Ltd.
Sandy Yang/Diretora de Estratégia Global
WhatsApp/WeChat: +86 13426366826
E-mail: yangyd@qianxingdata.com
Site: www.qianxingdata.com/www.storagesserver.com
Foco de negócios:
Distribuição de produtos de TIC/integração de sistemas e serviços/soluções de infraestrutura
Com mais de 20 anos de experiência em distribuição de TI, fazemos parcerias com marcas líderes globais para fornecer produtos confiáveis e serviços profissionais.
“Usando a tecnologia para construir um mundo inteligente”Seu provedor confiável de serviços de produtos de TIC!