很有意思也很实用的项目Edit Banana -- 让不可编辑的内容也能编辑 github.com/BIT-DataLab/Edit-Banana

很有意思也很实用的项目Edit Banana -- 让不可编辑的内容也能编辑
github.com/BIT-DataLab/Edit-Banana

上传一张图表的图片或pdf文件(自然是不可编辑的,除非p图),该项目可以将其转换为一张可编辑的DrawIO(XML)或svg或PPT文件。
原理大概是先用 SAM 3分割图片,然后做OCR。由多模态 LLM 指导的提取过程。
#




分类