首页 > 文章列表 > 如何使用QueryList快速提取HTML页面中P标签文本并转换为数组?

如何使用QueryList快速提取HTML页面中P标签文本并转换为数组?

401 2025-03-25

如何使用QueryList快速提取HTML页面中P标签文本并转换为数组?

使用 querylist 快速读取 html 中 p 标签数据

在 html 页面中,想要读取 <p> 标签内的文本内容并将其分数组,可以使用基于 php 的开源框架 querylist。

步骤:

  1. 安装 querylist 框架
  2. 实例化 querylist 对象,并将 html 文档作为参数传递
  3. 使用链式方法检索所有 <p> 标签
  4. 从 <p> 标签中提取文本内容
  5. 将文本内容存储在数组中

示例代码:

<?php
require 'vendor/autoload.php';

use QLQueryList;

$html = '<p>第四章 医学微生物学(助理不考)</p><p>第一节 微生物的基本概念</p>';
$ql = QueryList::html($html);

$result = $ql->find('p')->texts()->toArray();

print_r($result); // 输出:Array ( [0] => 第四章 医学微生物学(助理不考) [1] => 第一节 微生物的基本概念 )
?>

注:

  • 省事一点,可以直接使用 querylist 进行数据读取,无需逐个编写复杂的正则表达式。
  • querylist 框架提供了丰富的选择器和操作方法,可以方便地处理 html 文档。
来源:1732831468