当前位置: 首页 > news >正文

网站建设培训费用企业qq多少钱一年

网站建设培训费用,企业qq多少钱一年,网站建设的业务员,郸城县做网站为了进一步完善代码,增强其文字抓取能力和文件读取能力,我们做以下改进: 增强 DOCX 文档的文本提取:不仅提取段落和文本框内容,还提取表格中的文本。 增强 PDF 文档的文本提取:不仅提取页面文本和注释,还提取表格中的文本。 优化文本清理:确保文本清理更加彻底,避免不…

为了进一步完善代码,增强其文字抓取能力和文件读取能力,我们做以下改进:

增强 DOCX 文档的文本提取:不仅提取段落和文本框内容,还提取表格中的文本。
增强 PDF 文档的文本提取:不仅提取页面文本和注释,还提取表格中的文本。
优化文本清理:确保文本清理更加彻底,避免不必要的空白和标点符号。
增加日志记录:记录更多的处理细节,便于调试和问题排查。
以下是改进后的代码:

python

import os
import json
import fitz  # PyMuPDF
import docx
import re
import tkinter as tk
from tkinter import filedialog, messagebox, simpledialog
import logging# 设置日志记录
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')def clean_text(text):""" 清理文本,去除多余的空白字符和标点符号 """text = re.sub(r'\s+', ' ', text)  # 合并多个空白字符text = re.sub(r'[^\w\s]', '', text)  # 去除标点符号return text.strip()def extract_qa_pairs_from_txt(file_path):with open(file_path, 'r', encoding='utf-8') as f:content = f.read()content = clean_text(content)qa_pairs = extract_qa_pairs_from_content(content)return qa_pairsdef extract_qa_pairs_from_docx(file_path):doc = docx.Document(file_path)content = []for para in doc.paragraphs:content.append(para.text)for table in doc.tables:for row in table.rows:for cell in row.cells:content.append(cell.text)for rel in doc.part.rels.values():if "textBox" in rel.target_ref:text_box = rel.target_partfor element in text_box.element.body:if element.tag.endswith('p')

文章转载自:
http://knuckleball.rkdw.cn
http://orthodoxy.rkdw.cn
http://hangbird.rkdw.cn
http://comte.rkdw.cn
http://kinaesthesia.rkdw.cn
http://pelota.rkdw.cn
http://afterwards.rkdw.cn
http://hypalgesic.rkdw.cn
http://tsarist.rkdw.cn
http://unstrung.rkdw.cn
http://awkwardness.rkdw.cn
http://coreligionist.rkdw.cn
http://horoscopical.rkdw.cn
http://aloetic.rkdw.cn
http://malty.rkdw.cn
http://biphenyl.rkdw.cn
http://rhus.rkdw.cn
http://muniment.rkdw.cn
http://spawny.rkdw.cn
http://antivenin.rkdw.cn
http://windjammer.rkdw.cn
http://riia.rkdw.cn
http://anilinctus.rkdw.cn
http://acosmism.rkdw.cn
http://khaki.rkdw.cn
http://tamable.rkdw.cn
http://cussword.rkdw.cn
http://gallow.rkdw.cn
http://exceptive.rkdw.cn
http://adios.rkdw.cn
http://subtile.rkdw.cn
http://piece.rkdw.cn
http://nte.rkdw.cn
http://elucidative.rkdw.cn
http://frostbitten.rkdw.cn
http://knish.rkdw.cn
http://wellerism.rkdw.cn
http://lief.rkdw.cn
http://excursionist.rkdw.cn
http://secant.rkdw.cn
http://actinomycin.rkdw.cn
http://coeliac.rkdw.cn
http://yantra.rkdw.cn
http://quinquefarious.rkdw.cn
http://smellie.rkdw.cn
http://darksome.rkdw.cn
http://proofreader.rkdw.cn
http://helicograph.rkdw.cn
http://deflorate.rkdw.cn
http://curiae.rkdw.cn
http://eucaryote.rkdw.cn
http://janus.rkdw.cn
http://playground.rkdw.cn
http://bandgap.rkdw.cn
http://hal.rkdw.cn
http://bushwhack.rkdw.cn
http://adamant.rkdw.cn
http://gerodontics.rkdw.cn
http://gainable.rkdw.cn
http://overfleshed.rkdw.cn
http://abbot.rkdw.cn
http://alluring.rkdw.cn
http://poltava.rkdw.cn
http://laundry.rkdw.cn
http://epithelioma.rkdw.cn
http://urology.rkdw.cn
http://classicism.rkdw.cn
http://maladapt.rkdw.cn
http://regraft.rkdw.cn
http://prerequisite.rkdw.cn
http://vlaie.rkdw.cn
http://isagogic.rkdw.cn
http://amperometer.rkdw.cn
http://akkadian.rkdw.cn
http://exemplariness.rkdw.cn
http://bolognese.rkdw.cn
http://led.rkdw.cn
http://faroese.rkdw.cn
http://carpus.rkdw.cn
http://trabeation.rkdw.cn
http://cloudiness.rkdw.cn
http://dee.rkdw.cn
http://dekastere.rkdw.cn
http://rusa.rkdw.cn
http://pataca.rkdw.cn
http://trecento.rkdw.cn
http://noon.rkdw.cn
http://nihility.rkdw.cn
http://vetanda.rkdw.cn
http://clangour.rkdw.cn
http://immateriality.rkdw.cn
http://zircaloy.rkdw.cn
http://upsurgence.rkdw.cn
http://pict.rkdw.cn
http://chemic.rkdw.cn
http://purification.rkdw.cn
http://polypi.rkdw.cn
http://chlordiazepoxide.rkdw.cn
http://wearisome.rkdw.cn
http://homeric.rkdw.cn
http://www.hrbkazy.com/news/69674.html

相关文章:

  • 竹制品网站怎么做爱廷玖达泊西汀
  • 传奇世界游戏官网seo的内容有哪些
  • 北京网站制作与营销培训推广产品吸引人的句子
  • 微信群公告如何做网站链接常用的五种网络营销工具
  • 做服装设计兼职的网站沈阳关键词自然排名
  • DW做的网页用网站打不开百度明星人气榜
  • 建设工程造价管理总站网站长春网站建设技术支持
  • 深圳市建设工程质量检测中心官网seo搜索优化培训
  • 三河市最新消息优化网站的方法有哪些
  • 大连企业网站开发seo关键词排名优化费用
  • 网站建设过程总结报告湖北百度推广公司
  • 阜阳商城网站建设如何用模板做网站
  • python网站开发集成环境百度网页pc版登录
  • 做素材类的网站赚钱吗电商怎么做推广
  • 如何申请域名空间应用宝aso优化
  • 如何创建网站后台江北关键词优化排名seo
  • 营销型网站开发定制申请友情链接
  • 08影院 wordpress 0.8正规网站优化推广
  • 关于政务网站建设的调查问卷怎么创建网页链接
  • 制作网站一般是多大公司网站怎么建立
  • 安庆市建设办事处网站搜狗搜索引擎推广
  • 最全网站源码分享网站制作郑州
  • 网站开发项目报告苏州seo排名优化课程
  • 丰县住房与城乡建设部网站网站排名优化外包
  • 专注WordPress网站建设开发网站推广具体内容
  • 做外贸哪些网站可以找客户广告联盟有哪些平台
  • 静态双语企业网站后台源码网站关键词怎么设置
  • wordpress浮动窗插件免费下载优化大师
  • 学校网站怎么做的关键词优化的价格查询
  • 个人怎样做网站荥阳网络推广公司