用javascript统计pdf的字数

阅读本文大约需要: <1 分钟

ACSI项目。因为学生版文件没有用OCR转出到SmartCAT上,所以需要统计pdf文件的字数。

说起来,ACSI是一个很大的项目,我们至少需要翻译4门课,还需要编写两门课——都是从Pre-K到G-12。

为此,我买了正版的adobe acrobat pro,foxit pro,以及indesign pro三个软件。呵呵,我们别的项目组都没舍得买。似乎我渐渐开始习惯为软件、服务器、工具付钱了。


acrobat pro支持javascript,所以算是支持插件了。我觉得有空应该写一个pdf自动翻译器,连上google 或者microsoft的api,自动翻译pdf文件。算了,我不会有空的,除了hello world,我什么都不会写的。

PDF字数统计程序

首先在acrobat pro中用ctrl-k打开偏好设置,选择javascript, check “enable acrobat javascript”和”enable interactive console”。

然后,打开想要的文件,用ctrl-j打开js控制面板。

至于程序:

var cnt=0;

for (var p = 0; p < this.numPages; p++) cnt += getPageNumWords(p);

console.println(“There are ” + cnt + ” words in this file.”);

就是简单的几行而已。google上抄来的,我懒得研究api文档。

运行字数统计程序

这算不得程序吧。

首先,crtl-a全选,然后crtl-enter运行。Pre-K第一单元学生用书的字数:

There are 163 words in this file.

true

acrobat pro专门告诉我,163个字,真的。

Leave a Reply

Your email address will not be published.

This site uses Akismet to reduce spam. Learn how your comment data is processed.