成语| 古诗大全| 扒知识| 扒知识繁体

当前位置:首页 > 趣味生活

如何提取word中的文字

Q1:如何将图片上的文字提取出来,并且保存为word文档?

提取图片中的文字方法很多,我们可以利用软件直接将JPG图片转为WORD文档,相当于PDF格式转换,那么一种是手机APP,但是最好用的涂书笔记下架了。那么我们如果找电脑软件又比较麻烦,但是我们可以利用在线网站去操作。

比如我们要这一张图片中的文字

1.我们百度迅捷PDF转化器,进入在线网站操作

我们在菜单栏中找到OCR识别,找到图片OCR识别,为什么要选择这个呢?图片是默认为扫描文件而不是单纯的PDF文件

2.点击后点击选择文件上传我们的JPG图片3.然后点击开始识别4.设置要的WORD文档格式5.待转换完成后下载即可

最终效果

但是这样的是默认为文本框格式哦,所以建议大家纯文字图片选择TXT格式文件,然后再转为WORD

Q2:word中怎么把某部分文字提取出来

word中把某部分文字提取出来:
工具:wps中的word
选中要提取的文字,按Ctrl + X 剪切 ,然后鼠标点到要存放的wps文档的某个空白处,按Ctrl + V 粘贴

Q3:word文档中的图片里面的文字如何提取?

1可以先复制图片,到系统自带的“画图”里粘贴,另存为tiff格式图片;2.打开office工具里的Microsoft Office Document Imaging文字识别软件(不是默认安装,需要在安装office时,选“自定义安装”,勾选office工具才会有),将刚才保存的tiff格式图片调进来,先用ocr识别文本,然后发送到word就ok了。

Q4:如何批量把word中的文字提取到excel中对应位置

按照下面的步骤来就能达到你的效果了。把excel中的名字批量导入到word文件中的同一位置:
1、打开文字文档以后,先做好表格,接着找到文档中工具栏的“工具”按钮。
2、点击之后,就会弹出一个命令菜单,在其中找到“邮件合并工具栏”,点击“邮件合并工具栏”以后就会出现一个工具栏了。
3、在这个工具栏中找到图标,点击打开数据源。
4、接着就会出现一个选择框,选择好需要导入的数据源excel文件,点击确定。
5、接着鼠标点击要导入数据文档表格中的单元格,让光标在这个单元格总闪动,然后点击图标“插入合并域”。
6、接着选择要输入的项目,点击确定,就能看到单元格里出现了《姓名》,出生日期和性别也可以用同样的方法输入。
7、然后点击”合并到新文档“,在合并到新文档设置中选择要导入的数据起始行和结束行,点击确定。
8、接着会发现excel中的数据全部导入到了文档的表格里。

Q5:word中文字的提取问题

编辑 → 查找 查找内容:a*b √“突出显示所有在该范围内的项目” 高级 → √“使用通配符”最后单击“查找全部”即可选中全部的 a*b ,然后就可以复制或者剪切出来了。

Q6:如何用c#读取word中的某一段文字

三种方法:
一是直接读取.doc文档,可以将所有的文本读入到字符串中在做相关处理:
C# code?
1、2、3、
using System.IO;string temp = System.IO.File.OpenText(@“D:\word.doc”).ReadToEnd();//读取doc文档
二是通过调用.NET对于Office的COM组件来做:
C# code?
1、2、3、4、5、6、7、8、9、10、11、12、13、
using Microsoft.Office.Interop.Word;Microsoft.Office.Interop.Word.Application app = new Microsoft.Office.Interop.Word.Application();//打开word程序
Microsoft.Office.Interop.Word.Document doc = null;//实例化一个新的word文档object unknow = Type.Missing;
app.Visible = true;
doc = app.Documents.Open(ref fileName,
ref unknow,ref unknow,ref unknow,ref unknow,ref unknow,
ref unknow,ref unknow,ref unknow,ref unknow,ref unknow,
ref unknow,ref unknow,ref unknow,ref unknow,ref unknow);string temp = doc.Content.Text.Trim();//将全篇内容存入字符串中,也可以调用别的方法,具体可以查询MSDN...
三是将Word转为XML,可以根据要求提取内容,包括标题,目录等等~~
C# code?
1、2、3、4、5、6、7、8、9、10、11、
using System.XML;XmlDocument doc = new XmlDocument();
doc.Load(filePath);//载入XML文档XmlElement root = doc.DocumentElement;//定义载入XML的根节点 foreach(XmlNode xn1 in root.ChildNodes)//对于根节点以外的子节点做循环,以下同理
{
//对元素处理~~~
}
http://bbs.csdn.net/topics/280041104

Q7:怎么提取Word文档里的文字

是在有表格情况下,还是单纯的文字?

方法一:

在表格的情况下,将文字提出来:

1、托选表格的文字,点击——右键复制——右键“选择性粘贴”弹出对话框如下:

选择——“无格式文本”——“确定”,这样就将表格中的文字提取出来了。

方法二:

我目前用的是2013版本的word:

 a:选中整个表格,工具栏上面就会出现表格工具栏,如图:

选择转换成文本:如图:

选择——其他字符 就全部变成文字,表格消失。

2、2003版word步骤如下:

1、选中整个表格,点击菜单栏中的“表格”,光标移至“转换”,点击下拉菜单中的“表格转化成文本”;

2、在弹出的“表格转化成文本”对话框中选择合适的文字分隔符,点击“确定”即可。

方法有很多,自己多多尝试,不懂多问,多看,很多不懂的,困难的就迎刃而解了。

猜你喜欢

更多