АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

StringTokenizer(String str, String delimiters,

Читайте также:
  1. Dim basa As Database, nabor As Recordset, поля As Field, имена As String
  2. Dim basa As Database, zapros As QueryDef, s As String
  3. Dim basa As Database, zapros As QueryDef, s As String, bucva As String
  4. Java.lang.String Java SE 6
  5. Scanner(ReadableByteChannel source, String charset)
  6. ВЯЖУЩИЕ СРЕДСТВА (ADSTRINGENTIA)
  7. Настройка компонент StringGrid
  8. Настройка компонента TStringGrid
  9. Настройка компоненты StringGrid

Boolean delimAsToken);

Некоторые методы:

String nextToken() – возвращает лексему как String объект;

boolean hasMoreTokens() – возвращает true, если одна или несколько лексем остались в строке;

int сountToken() – возвращает число лексем.

Класс был реализован в самой первой версии языка. Однако в настоящее время существуют более совершенные средства по обработке текстовой информации – регулярные выражения.

Регулярные выражения

Класс java.util.regex.Pattern применяется для определения регулярных выражений (шаблонов), для которых ищется соответствие в строке, файле или другом объекте, представляющем последовательность символов. Для определения шаблона применяются специальные синтаксические конструкции. О каждом соответствии можно получить информацию с помощью класса java.util.regex.Matcher.

Далее приведены основные логические конструкции для задания шаблона.

Если в строке, проверяемой на соответствие, необходимо, чтобы в какой-либо позиции находился один из символов некоторого символьного набора, то такой на­бор (класс символов) можно объявить, используя одну из следующих конструкций:

[abc] a, b или c
[^abc] символ, исключая a, b и c
[a-z] символ между a и z
[a-d[m-p]] либо между a и d, либо между m и p
[e-z&&[dem]] e либо m (конъюнкция)

Кроме стандартных классов символов, существуют предопределенные классы символов:

. любой символ
\d [0-9]
\D [^0-9]
\s [ \t\n\x0B\f\r]
\S [^\s]
\w [a-zA-Z_0-9]
\W [^\w]
\p{javaLowerCase} ~ Character.isLowerCase()
\p{javaUpperCase} ~ Character.isUpperCase()

При создании регулярного выражения могут использоваться логические операции:

ab после a следует b
a|b a либо b
(a) a

Скобки, кроме их логического назначения, также используются для выделения групп.

Для определения регулярных выражений недостаточно одних классов символов, т. к. в шаблоне часто нужно указать количество повторений. Для этого существуют квантификаторы.

a? a один раз или ни разу
a* a ноль или более раз
a+ a один или более раз
a{n} a n раз
a{n,} a n или более раз
a{n,m} a от n до m

Существует еще два типа квантификаторов, которые образованы прибавлением суффикса ? (слабое, или неполное совпадение) или + («жадное», или собственное совпадение) к вышеперечисленным квантификаторам. Неполное совпадение соответствует выбору с наименее возможным количеством символов, а собственное – с максимально возможным.

Класс Pattern используется для простой обработки строк. Для более сложной обработки строк используется класс Matcher , рассматриваемый ниже.

В классе Pattern объявлены следующие методы:

Pattern compile(String regex) – возвращает Pattern, который соответствует regex.

Matcher matcher(CharSequence input) – возвращает Matcher,
с помощью которого можно находить соответствия в строке input.

boolean matches(String regex, CharSequence input) – проверяет на соответствие строки input шаблону regex.

String pattern() – возвращает строку, соответствующую шаблону.

String[] split(CharSequence input) – разбивает строку input, учитывая, что разделителем является шаблон.

String[] split(CharSequence input, int limit) – разбивает строку input на не более чем limit частей.

С помощью метода matches() класса Pattern можно проверять на соответствие шаблону целой строки, но если необходимо найти соответствия внутри строки, например, определять участки, которые соответствуют шаблону, то класс Pattern не может быть использован. Для таких операций необходимо использовать класс Matcher.

Начальное состояние объекта типа Matcher не определено. Попытка выз­вать какой-либо метод класса для извлечения информации о найденном соответствии приведет к возникновению ошибки IllegalStateException. Для того чтобы начать работу с объектом Matcher, нужно вызвать один из его методов:

boolean matches() – проверяет, соответствует ли вся строка шаблону;

boolean lookingAt() – пытается найти последовательность символов, начинающуюся с начала строки и соответствующую шаблону;

boolean find() или boolean find(int start) – пытается найти последовательность символов, соответствующих шаблону, в любом месте строки. Параметр start указывает на начальную позицию поиска.

Иногда необходимо сбросить состояние Matcher ’а в исходное, для этого применяется метод reset() или reset(CharSequence input), который также устанавливает новую последовательность символов для поиска.

Для замены всех подпоследовательностей символов, удовлетворяющих шаблону, на заданную строку можно применить метод replaceAll(String
replacement)
.

Для того чтобы ограничить поиск границами входной последовательности, применяется метод region(int start, int end), а для получения значения этих границ – regionEnd() и regionStart(). С регионами связано несколько методов:

Matcher useAnchoringBounds(boolean b) – если установлен в true, то начало и конец региона соответствуют символам ^ и $ соответственно.

boolean hasAnchoringBounds() – проверяет закрепленность границ.

В регулярном выражении для более удобной обработки входной после­довательности применяются группы, которые помогают выделить части найденной подпоследовательности. В шаблоне они обозначаются скобками “ ( “ и “ ) ”. Номера групп начинаются с единицы. Нулевая группа совпадает со всей найденной подпоследовательностью. Далее приведены методы для извлечения информации о группах.

int end() – возвращает индекс последнего символа подпоследовательности, удовлетворяющей шаблону;

int end(int group) – возвращает индекс последнего символа указанной группы;

String group() – возвращает всю подпоследовательность, удовлетворяющую шаблону;

String group(int group) – возвращает конкретную группу;

int groupCount() – возвращает количество групп;

int start() – возвращает индекс первого символа подпоследовательности, удовлетворяющей шаблону;

int start(int group) – возвращает индекс первого символа указанной группы;

boolean hitEnd() – возвращает истину, если был достигнут конец входной последовательности.

Следующий пример показывает как можно использовать возможности классов Pattern и Matcher для поиска, разбора и разбивки строк.

/* пример # 14: обработка строк с помощью шаблонов: DemoRegular.java */

package chapt07;

import java.util.regex.*;

 

public class DemoRegular {

public static void main(String[] args) {

//проверка на соответствие строки шаблону

Pattern p1 = Pattern. compile ("a+y");

Matcher m1 = p1.matcher("aaay");

boolean b = m1.matches();

System. out. println(b);

//поиск и выбор подстроки, заданной шаблоном

String regex =

"(\\w+)@(\\w+\\.)(\\w+)(\\.\\w+)*";

String s =

"адреса эл.почты:mymail@tut.by и rom@bsu.by";

Pattern p2 = Pattern. compile (regex);

Matcher m2 = p2.matcher(s);

while (m2.find())

System.out.println("e-mail: " + m2.group());

 

//разбивка строки на подстроки с применением шаблона в качестве разделителя

Pattern p3 = Pattern. compile ("\\d+\\s?");

String[] words =

p3.split("java5tiger 77 java6mustang");

for (String word: words)

System.out.println(word);

}

}

В результате будет выведено:

True

e-mail: mymail@tut.by

e-mail: rom@bsu.by

Java

Tiger

Java


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 | 102 | 103 | 104 | 105 | 106 | 107 | 108 | 109 | 110 | 111 | 112 | 113 | 114 | 115 | 116 | 117 | 118 | 119 | 120 | 121 | 122 | 123 | 124 | 125 | 126 | 127 | 128 | 129 | 130 | 131 | 132 | 133 | 134 | 135 | 136 | 137 | 138 | 139 | 140 | 141 | 142 | 143 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.012 сек.)