From Wikipedia, the free encyclopedia Từ Wikipedia tiếng Việt



tải về 308.69 Kb.
trang1/6
Chuyển đổi dữ liệu07.06.2018
Kích308.69 Kb.
#39586
  1   2   3   4   5   6

Regular expression

From Wikipedia, the free encyclopedia Từ Wikipedia tiếng Việt


Jump to: navigation , search Jump to: navigation, search

In computing , regular expressions provide a concise and flexible means for identifying strings of text of interest, such as particular characters, words, or patterns of characters. Trong máy tính, thường xuyên cung cấp một cách nói ngắn gọn và linh hoạt, có nghĩa là trong việc xác định những dây quan tâm của văn bản, chẳng hạn như ký tự đặc biệt, từ ngữ, hay các mẫu của các ký tự. Regular expressions (abbreviated as regex or regexp , with plural forms regexes , regexps , or regexen ) are written in a formal language that can be interpreted by a regular expression processor, a program that either serves as a parser generator or examines text and identifies parts that match the provided specification. Biểu thức thông thường (viết tắt là regex hoặc regexp, với hình thức plural regexes, regexps, hoặc regexen) được viết bằng một ngôn ngữ chính thức có thể được giải thích bởi một biểu hiện thường xuyên xử lý, hoặc là một chương trình phục vụ như một parser Máy phát điện hoặc kiểm tra văn bản và xác định phần phù hợp với các đặc điểm kỹ thuật được cung cấp.

The following examples illustrate a few specifications that could be expressed in a regular expression: Dưới đây là những ví dụ minh họa một số kỹ thuật mà có thể được thể hiện trong một biểu thức chính quy:

  • the sequence of characters "car" in any context, such as "car", "cartoon", or "bicarbonate" trong chuỗi các ký tự "xe hơi" trong bất kỳ bối cảnh, chẳng hạn như "xe hơi", "cartoon", hay "cacbonat"

  • the word "car" when it appears as an isolated word chữ "xe" khi nó xuất hiện như là một cô lập từ

  • the word "car" when preceded by the word "blue" or "red" chữ "xe" khi preceded bởi từ "xanh" hoặc "đỏ"

  • a dollar sign immediately followed by one or more digits, and then optionally a period and exactly two more digits một đô la đăng ngay lập tức theo sau bởi một hoặc nhiều chữ số, và sau đó tùy chọn một khoảng thời gian và chính xác hơn hai chữ số

Regular expressions can be much more complex than these examples. Biểu thức thông thường có thể được nhiều hơn nữa những ví dụ phức tạp hơn.

Regular expressions are used by many text editors , utilities, and programming languages to search and manipulate text based on patterns . Biểu thức thông thường được sử dụng nhiều trình soạn thảo văn bản, tiện ích, và ngôn ngữ lập trình để tìm kiếm và thao tác văn bản dựa trên các mẫu. For example, Perl , Ruby and Tcl have a powerful regular expression engine built directly into their syntax. Ví dụ, Perl, RubyTcl có một thế lực biểu hiện thường xuyên công cụ xây dựng trực tiếp vào cú pháp của họ. Several utilities provided by Unix distributions—including the editor ed and the filter grep —were the first to popularize the concept of regular expressions. Một số tiện ích được cung cấp bởi UNIX-phân phối bao gồm các biên tập ed và các bộ lọc grep-là người đầu tiên đã được phổ biến khái niệm về các biểu thức bình thường.

As an example of the syntax, the regular expression \bex can be used to search for all instances of the string " ex " that occur after word boundaries (signified by the \b ). Như là một ví dụ của các cú pháp, thường xuyên biểu hiện \bex có thể được sử dụng để tìm kiếm cho tất cả các trường trong chuỗi "ex" xảy ra sau khi từ ranh giới (signified do \b Thus in the string "Texts for experts," \bex matches the " ex " in "experts" but not in "Texts" (because the " ex " occurs inside a word and not immediately after a word boundary). Vì vậy, trong chuỗi "văn bản cho các chuyên \bex \ \bex khớp với "ex" trong "chuyên gia" nhưng không phải ở trong "văn bản" (vì "ex" xảy ra một từ bên trong và ngay lập tức sau khi không một từ ranh giới).

Many modern computing systems provide wildcard characters in matching filenames from a file system . Nhiều máy tính hiện đại, các hệ thống cung cấp các ký tự đại diện các ký tự trong phù hợp với tên tập tin từ một hệ thống tập tin. This is a core capability of many command-line shells and is also known as globbing . Đây là một khả năng, năng lực cốt lõi của nhiều dòng lệnh-hệ vỏ và cũng được biết đến như là globbing. Wildcards differ from regular expressions in that they generally only express very limited forms of alternatives. Wildcards khác nhau từ các biểu thức bình thường trong mà họ thường chỉ thể hiện một số rất ít các hình thức lựa chọn thay thế.

Contents Nội dung


[hide]

  • 1 Basic concepts 1 khái niệm cơ bản

  • 2 History 2 Lịch sử

  • 3 Formal language theory 3 thức ngôn ngữ lý thuyết

  • 4 Syntax 4 Syntax

    • 4.1 POSIX 4,1 posix

      • 4.1.1 POSIX Basic Regular Expressions 4.1.1 posix cơ bản các biểu thức bình thường

      • 4.1.2 POSIX Extended Regular Expressions 4.1.2 posix mở rộng các biểu thức bình thường

      • 4.1.3 POSIX character classes 4.1.3 posix ký tự các lớp học

    • 4.2 Perl-derivative regular expressions 4,2 Perl-phẩm dựa trên phần mềm các biểu thức bình thường

    • 4.3 Simple Regular Expressions 4,3 rất đơn giản các biểu thức bình thường

    • 4.4 Lazy quantification 4,4 Lazy quantification

  • 5 Patterns for non-regular languages 5 mẫu cho người không thường xuyên ngôn ngữ

  • 6 Implementations and running times 6 triển khai và chạy lần

  • 7 Regular expressions and Unicode 7 biểu hiện thường xuyên và Unicode

  • 8 Uses of regular expressions 8 Sử dụng của các biểu thức bình thường

  • 9 See also 9 Xem thêm

  • 10 Notes 10 Ghi chú

  • 11 References 11 Tham khảo

  • 12 External links 12 Liên kết ngoài


tải về 308.69 Kb.

Chia sẻ với bạn bè của bạn:
  1   2   3   4   5   6




Cơ sở dữ liệu được bảo vệ bởi bản quyền ©hocday.com 2024
được sử dụng cho việc quản lý

    Quê hương