码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • php将word中的omath转成mathml


    获取word的xml后,可用以下方式将所有的公式都提取并转换成mathml格式,再根据 自己的业务场景进行转换成latex、公式图片即可,mathml可用mathjax直接渲染。

    		// 解析xml
            $xml_document_weizhi = stripos($xml, '');
            $xml_document  = substr($xml, 0, $xml_document_weizhi);
            
            $mml_arrs= [];
    
            // 提取所有的公式,转化成mathml
            libxml_disable_entity_loader(false);
            preg_replace_callback('/()([\s\S]*?)(<\/m:oMath>)/', function ($matches) use ($xml_document,&$mml_arrs) {
                $mml =$xml_document.'' . $matches[0] . '';
                $domDocument = new DOMDocument();
                $domDocument->loadXML($mml);
                $numberings = $domDocument->getElementsByTagNameNS('http://schemas.openxmlformats.org/wordprocessingml/2006/main', 'body');
                $numberings = $numberings->item(0);
                $xsl        = new DOMDocument();
                $xsl->load('OMML2MML.XSL');
                $processor = new XSLTProcessor();
                $processor->importStyleSheet($xsl);
                $omml                = $processor->transformToXML($numberings);
                $omml                = str_replace('', '', $omml);
                $omml                = str_replace('xmlns:m="http://schemas.openxmlformats.org/officeDocument/2006/math"', '', $omml);
                $omml                = str_replace("mml:", '', $omml);
                $omml                = str_replace("\n", '', $omml);
     			// 上面转换后部分公式非斜体,但是使用mathjax渲染时还是斜体,就把mi改成mo
                $omml = str_replace("'","'",$omml);
              
                $omml = str_replace("'","'",$omml);
                // 公式中的导数符号被解析成了单引号,经过尝试后用如下格式的mathml使用mathjax渲染后可用!
                $omml = str_replace("'","'",$omml);
                // 将公式中的斜体的中文都改成正体,在word中明明已取消了斜体,但是解析道德还是斜体,故批量把斜体中文改成正常字体
                $omml = preg_replace('/([\x{4e00}-\x{9fa5}]+)<\/mi>/isu','$1',$omml);
                $mml_arrs[] = $omml;
                return "";
            }, $xml);
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
  • 相关阅读:
    想在期货市场存活 需要关注什么数据?
    Go 在运维开发中的应用
    Android Studio新建项目教程
    ArcGIS实验教程——实验四十七:数据驱动页工具批量制作甘肃省各地级市人口七普专题图集
    IP地址与代理ip在网络安全中的关键作用
    mac常见问题(五) Mac 无法开机
    深入解析MySQL数据库存储数据的方式(上)
    MSYS2下搭建Qt开发环境
    ElasticSearch (一)ElasticSearch 入门简介
    金融期货和期权等品种权限
  • 原文地址:https://blog.csdn.net/Golderant/article/details/133140766
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号