PHP 4 на практике

       

Преобразование HTML в простой текст


Иногда возникает необходимость преобразовать файл в формате HTML в простой текст. Функции, описанные ниже, помогут вам в решении этой задачи.

strip_tags( )

Функция strip_tags( ) удаляет из строки все теги HTML и РНР, оставляя в ней только текст. Синтаксис функции strip_tags( ):

string strip_tags (string строка [, string разрешенные_тerи])

Необязательный параметр разрешенные_теги позволяет указать теги, которые должны пропускаться в процессе удаления.

Ниже приведен пример удаления из строки всех тегов HTML функцией strip_tags( ):

$user_input = "I just <b>love</b> РНР and <i>gourment</i> recipes!";

$stripped_input = strip_tags($user_input);

// $stripped_input = "I just love PHP and gourmet recipes!";

В следующем примере удаляются не все, а лишь некоторые теги:

$input = "I <b>love</b> to <a href = \"http://www.eating.com\">eat!</a>!";

$strip_input = strip_tags ($user_input, "<a>");

// $strip_input = "I love to <a href = \"http://www.eating.com\">eat!</a>!";



Удаление тегов из текста также производится функцией fgetss( ), описанной в главе 7.

get_meta_tags( )

Хотя функция get_meta_tags( ) и не имеет прямого отношения к преобразованию текста, зто весьма полезная функция, о которой следует упомянуть. Синтаксис функции get_meta_tags( ):

array get_meta_tags (string имя_файла/URL [, int включение_пути])

Функция get_meta_tags( ) предназначена для поиска в файле HTML тегов МЕТА.

Теги МЕТА содержат информацию о странице, используемую главным образом поисковыми системами. Эти теги находятся внутри пары тегов <head>...</head>. Применение тегов МЕТА продемонстрировано в следующем фрагменте (назовем его example.html, поскольку он будет использоваться в листинге 8.2):

<html>

<head>

<title>PHP Recipes</title>

<meta name="keywords" content="gourmet. PHP, food. code, recipes, chef, programming, web">


<meta name="description" content=" PHP Recipes provides savvy readers with the latest in PHP

programming and gourmet cuisine!">

<meta name="author" content="WJ Gilmore">

</head>

Функция get_meta_tags( ) ищет в заголовке документа теги, начинающиеся словом МЕТА, и сохраняет имена тегов и их содержимое в ассоциативном массиве. В листинге 8.2 продемонстрировано применение этой функции к файлу example.html.

Листинг 8.2.

Извлечение тегов МЕТА из файла HTML функцией get_meta_tags( )

$meta_tags = get_meta_tags("example.html"):

// Переменная $meta_tags содержит массив со следующей информацией:

// $meta_tags["keywords"] = "gourmet. PHP. food. code, recipes, chef, programming. Web":

// $meta_tags["description"] = "PHP Recipes provides savvy readers with the latest in PHP

programming and gourmet cuisine";

// $meta_tags["author"] = "WJ Gilmore";

Интересная подробность: данные тегов МЕТА можно извлекать не только из файлов, находящихся на сервере, но и из других URL.

Теги МЕТА и их использование превосходно описаны в статье Джо Берна (Joe Burn) «So, You Want a Meta Command, Huh?» на сайте HTML Goodies: http://htmlgoodies.earthweb.com/tutors/meta.html.


Содержание раздела