Plain text
Regular expression (regex)¶
Basics¶
|matches either expression()limit the scope of|\1\2backreference in search string$1$2backreference in replace string
A Single Character¶
.any one character[...]any character listed[^...]negated character class-
\charescaped -
\ttab \na newline character\ra carriage-return character\sany "whitespace" character-
\Sanything not\s -
\w=[a-zA-Z0-9_] \Wanything not\w\d=[0-9], a digit\Danything not\d
Quantifiers¶
?{0,1}*{0,\(\infty\)}+{1,\(\infty\)}{min, max}min required, max allowed
Start / end positions¶
^start of the line (caret)$end of the line (dollar)
Lookaround¶
(?<=)left yes(?<!)left no(?=)right yes(?!)right no
Text tools¶
Text difference checker¶
Unicode symbol lookup¶
- Unicode Character Table - Full List of Unicode Symbols (โโฟโ) SYMBL
- Unicode - Compart
- Discover Unicode Character Entities & Symbols | AmpWhat
- List of Unicode characters - Wikipedia
Mobile apps:
ASCII art generators¶
___ _____ ______________ ___ __
/ | / ___// ____/ _/ _/ / | _____/ /_
/ /| | \__ \/ / / / / / / /| | / ___/ __/
/ ___ |___/ / /____/ /_/ / / ___ |/ / / /_
/_/ |_/____/\____/___/___/ /_/ |_/_/ \__/
โโโ โโโโโโ โโโโโโ โโโ โโโ โโโ โโโโโโ โโโโโโโโโ
โโโโโโ โโโ โ โโโโ โโ โโโโโโโโ โโโโโโ โโโ โ โโโโ โโโ โโ
โโโ โโโ โ โโโโ โโโ โ โโโโโโโโ โโโ โโโ โโโ โโโ โโ โโโโ โโ
โโโโโโโโโ โ โโโโโโโ โโโโโโโโโโโโ โโโโโโโโโ โโโโโโโ โ โโโโ โ
โโ โโโโโโโโโโโโโโ โโโโโ โโโโโโโโโ โโ โโโโโโโโ โโโโ โโโโ โ
โโ โโโโโ โโโ โ โโ โโ โ โโโ โโ โโ โโโโโ โโ โโโโ โ โโ
โ โโ โโ โโ โ โ โ โ โ โ โ โ โ โโ โ โโ โ โโ โ
โ โ โ โ โ โ โ โ โ โ โ โ โโ โ โ
โ โ โ โ โ โ โ โ โ โ
โ
โโโโโโโโโ โโโโโโโโโ โโโโโโโโโ โโโโโ โโโโโ โโโโโโโโโ โโโโโ
โโโโโโโโโโโ โโโโโโโโโโโ โโโโโโโโโโโโโโโโ โโโโโ โโโโโโโโโโโ โโโโโ
โโโโ โโโโ โโโโ โโโ โโโ โโโ โโโโ โโโโ โโโโ โโโโ โโโโโโโโ โโโโโโโ
โโโโโโโโโโโโ โโโโโโโโโโโ โโโโ โโโโ โโโโ โโโโโโโโโโโโ โโโโโโโโโโโโโโโโโ
โโโโโโโโโโโโ โโโโโโโโโโโโโโโ โโโโ โโโโ โโโโโโโโโโโโ โโโโ โโโ โโโโ
โโโโ โโโโ โโโ โโโโโโโโโ โโโ โโโโ โโโโ โโโโ โโโโ โโโโ โโโโ โโโ
โโโโโ โโโโโโโโโโโโโโโโ โโโโโโโโโโโ โโโโโ โโโโโ โโโโโ โโโโโ โโโโโ โโโโโโโ
โโโโโ โโโโโ โโโโโโโโโ โโโโโโโโโ โโโโโ โโโโโ โโโโโ โโโโโ โโโโโ โโโโโ
.d888888 .d88888b a88888b. dP dP .d888888 dP
d8' 88 88. "' d8' `88 88 88 d8' 88 88
88aaaaa88a `Y88888b. 88 88 88 88aaaaa88a 88d888b. d8888P
88 88 `8b 88 88 88 88 88 88' `88 88
88 88 d8' .8P Y8. .88 88 88 88 88 88 88
88 88 Y88888P Y88888P' dP dP 88 88 dP dP
Character encoding¶
ASCII¶
-
ASCII (/หรฆskiห/), an acronym for American Standard Code for Information Interchange, is a character encoding standard for representing a particular set of 95 (English language focused) printable and 33 control characters โ a total of 128 code points.
The first 128 code points of Unicode are the same as ASCII.
UTF-8¶
-
UTF-8 is dominant for all countries/languages on the internet, is used in most standards, often the only allowed encoding, and is supported by all modern operating systems and programming languages.
The UTF-8 encoding of a Unicode code point is between 1 and 4 bytes:
- 1-byte character:
0xxxxxxx - 2-byte character:
110xxxxx 10xxxxxx - 3-byte character:
1110xxxx 10xxxxxx 10xxxxxx - 4-byte character:
11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
About Unicode: