LINUX_PHP_antiword_读取word文档

antiword官网[添加链接描述](http://www.winfield.demon.nl)下载安装antiwordcd /usr/local/wget http://www.winfield.demon.nl/linux/antiword-0.37.tar.gztar xvzf antiword-0.37.tar.gzcd antiword-0.37mak...

antiword官网[添加链接描述](http://www.winfield.demon.nl)

下载安装antiword
cd /usr/local/
wget http://www.winfield.demon.nl/linux/antiword-0.37.tar.gz
tar xvzf antiword-0.37.tar.gz
cd antiword-0.37
make && make install

自动安装到了/root/目录下,需要改一下路径和权限,方便以后调用 antiword命令
cp /root/bin/*antiword /usr/local/bin/
mkdir /usr/share/antiword
cp -R /root/.antiword/* /usr/share/antiword/
chmod 777 /usr/local/bin/*antiword
chmod 755 /usr/share/antiword/*

shell上测试使用
/usr/local/bin/antiword  你的word文档
如果中文码乱,再加上编码
/usr/local/bin/antiword   -w 0 -m UTF-8.txt  你的word文档
需要注意,word文档内容太少会提示: I'm afraid the text stream of this file is too small to handle.

php上使用
$filename = '你的word文档';
$content = shell_exec('/usr/local/bin/antiword -w 0 -m UTF-8.txt '.$filename);
//将串中所有可能的全角符转为半角符
//全角
$DBC = Array(
            '0' , '1' , '2' , '3' , '4' ,
            '5' , '6' , '7' , '8' , '9' ,
            'A' , 'B' , 'C' , 'D' , 'E' ,
            'F' , 'G' , 'H' , 'I' , 'J' ,
            'K' , 'L' , 'M' , 'N' , 'O' ,
            'P' , 'Q' , 'R' , 'S' , 'T' ,
            'U' , 'V' , 'W' , 'X' , 'Y' ,
            'Z' , 'a' , 'b' , 'c' , 'd' ,
            'e' , 'f' , 'g' , 'h' , 'i' ,
            'j' , 'k' , 'l' , 'm' , 'n' ,
            'o' , 'p' , 'q' , 'r' , 's' ,
            't' , 'u' , 'v' , 'w' , 'x' ,
            'y' , 'z' , '-' , ' ' , ':' ,
            '.' , ',' , '/' , '%' , '#' ,
            '!' , '@' , '&' , '(' , ')' ,
            '<' , '>' , '"' , ''' , '?' ,
            '[' , ']' , '{' , '}' , '\' ,
            '|' , '+' , '=' , '_' , '^' ,
            '¥' , ' ̄' , '`'
        );
// 半角
$SBC = Array(
        '0', '1', '2', '3', '4',
        '5', '6', '7', '8', '9',
        'A', 'B', 'C', 'D', 'E',
        'F', 'G', 'H', 'I', 'J',
        'K', 'L', 'M', 'N', 'O',
        'P', 'Q', 'R', 'S', 'T',
        'U', 'V', 'W', 'X', 'Y',
        'Z', 'a', 'b', 'c', 'd',
        'e', 'f', 'g', 'h', 'i',
        'j', 'k', 'l', 'm', 'n',
        'o', 'p', 'q', 'r', 's',
        't', 'u', 'v', 'w', 'x',
        'y', 'z', '-', ' ', ':',
        '.', ',', '/', '%', '#',
        '!', '@', '&', '(', ')',
        '<', '>', '"', '\'','?',
        '[', ']', '{', '}', '\\',
        '|', '+', '=', '_', '^',
        '$', '~', '`'
    );
$content
 = str_replace($DBC, $SBC, $str);  // 全角到半角
var_dump($content);

本文标题为:LINUX_PHP_antiword_读取word文档

基础教程推荐