老醋男
windows系统的话请用IE打开知网并下载,不会乱码,在Edge、chrom浏览器会乱码 
微软在MicrosoftOffice2003中的工具组件中有一个“MicrosoftOfficeDocumentImaging”的组件包,它可以直接执行光学字符识别(OCR),下面笔者就为大家介绍利用Office2003新增的OCR功能从图片中提取文字的方法。第一步我们需要安装“MicrosoftOfficeDocumentImaging”的组件,点“开始→程序”,在“MicrosoftOffice工具”里点“MicrosoftOfficeDocumentImaging”即可安装运行。第二步打开带有文字的图片或电子书籍等,找到你希望提取的页面,按下键盘上的打印屏幕键(PrintScreen)进行屏幕取图。第三步打开MicrosoftOfficeWord2003,将刚才的屏幕截图粘贴进去;点击“文件”菜单中的“打印”,在安装MicrosoftOfficeDocumentImaging组件后,系统会自动安装一个名为“MicrosoftOfficeDocumentImagingWriter”的打印机。如图2所示,在“打印机”下拉列表框中选择“MicrosoftOfficeDocumentImagingWriter”打印机,其他选项无须额外设置,点击“确定”按钮后,设定好文件输出的路径及文件名(缺省使用源文件名),然后很快就可以自动生成一个MDI格式的文档了。打开刚才保存的MDI类型文件,根据你的需要用鼠标选择文字内容(被选中的内容在红色的框内),然后单击鼠标右键,在弹出的快捷菜单中选择“将文本发送到Word”,即可将图片内容自动转换为一个新的Word文档,然后你就可以在Word文档中随心所欲地进行编辑了。提示:如果你不想将转换的内容输入到一个新的Word文档中,而是希望粘贴到一个已经打开的Word文档,只需在上面的操作中点击右键菜单的“复制”,然后再到指定文档中执行粘贴即可。
知网一般提供CAJ和PDF两种格式的文档,每种格式的文档都需要使用相应的阅读器来打开,在百度里面搜索和你下载的文档格式一致的阅读器(如CAJ阅读器、PDF阅读器,最好下绿色的,不用安装),安装即可。若这样还不能打开的话,试试换个浏览器打开你需要下载的文档页面,重新下载,如果这是可以正常打开,那就证明是浏览器有问题。若还是显示乱码,不能打开,那就是你下载的原文档已损坏,只能找找其它相关文档了。希望以上能够帮到你。
估计是上传的pdf格式文档造成的。转成word上传检测会好些。