跳到内容

Lance 格式规范

Lance 格式包含表格式和列式文件格式。当它们结合在一起时,我们称之为数据格式。因为 Lance 可以存储结构化和非结构化的多模态数据,所以 Lance 通常将表称为“数据集”。Lance 数据集旨在高效处理辅助索引、快速数据摄取和修改以及一套丰富的模式和数据演进功能。

功能标志

随着文件格式和数据集的发展,新的功能标志被添加到格式中。有两个独立的字段用于检查功能标志,具体取决于您是尝试读取还是写入表。读取器应该检查 reader_feature_flags 以查看是否有任何它不知道的标志。写入器应该检查 writer_feature_flags。如果任一方看到它们不知道的标志,它们应该在任何读写操作上返回“不支持”错误。