在读取excel的时候发现有些字段无法读取,通过把excel文件解压后对比发现,正常读取和不
能正常读取的字段在sharedString.xml中存储的格式有差异,取其中一个字段,如下图:
正常读取的
不能读取的
对比可以看到其区别,然后查找openxlsx对这块的处理,通过调试代码找到代码如下:
const char* XLSharedStrings::getString(uint32_t index) const
{auto iter = xmlDocument().document_element().children().begin();std::advance(iter, index);return iter->first_child().text().get();
}
通过分析代码上下文,并结合getString函数,发现该字段的内容分别存放到了多个下级节点中,所以无法处理上图的存储格式,找到问题了,做一个兼容即可,修改后的代码如下:
const char* XLSharedStrings::getString(uint32_t index) const
{auto iter = xmlDocument().document_element().children().begin();std::advance(iter, index);static std::string t;t = "";t = iter->first_child().text().get();pugi::xml_node iter_r = iter->first_child();while (!iter_r.empty()){if (!strcmp(iter_r.name(), "r")){pugi::xml_node iter_t = iter_r.first_child();while (!iter_t.empty()){if (!strcmp(iter_t.name(), "t")){t = t + iter_t.text().get();}iter_t = iter_t.next_sibling();}}iter_r = iter_r.next_sibling();}return t.c_str();
}