Skip to content

Plain text

Regular expression (regex)

Basics

  • | matches either expression
  • () limit the scope of |
  • \1 \2 backreference in search string
  • $1 $2 backreference in replace string

A Single Character

  • . any one character
  • [...] any character listed
  • [^...] negated character class
  • \char escaped

  • \t tab

  • \n a newline character
  • \r a carriage-return character
  • \s any "whitespace" character
  • \S anything not \s

  • \w = [a-zA-Z0-9_]

  • \W anything not \w
  • \d = [0-9], a digit
  • \D anything not \d

Quantifiers

  • ? {0,1}
  • * {0,\(\infty\)}
  • + {1,\(\infty\)}
  • {min, max} min required, max allowed

Start / end positions

  • ^ start of the line (caret)
  • $ end of the line (dollar)

Lookaround

  • (?<=) left yes
  • (?<!) left no
  • (?=) right yes
  • (?!) right no

Text tools

Text difference checker

Unicode symbol lookup

Mobile apps:

ASCII art generators

    ___   _____ ______________   ___         __ 
   /   | / ___// ____/  _/  _/  /   |  _____/ /_
  / /| | \__ \/ /    / / / /   / /| | / ___/ __/
 / ___ |___/ / /____/ /_/ /   / ___ |/ /  / /_  
/_/  |_/____/\____/___/___/  /_/  |_/_/   \__/  
 โ–„โ–„โ–„        โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆ  โ–„โ–ˆโ–ˆโ–ˆโ–ˆโ–„   โ–ˆโ–ˆโ–“ โ–ˆโ–ˆโ–“    โ–„โ–„โ–„       โ–ˆโ–ˆโ–€โ–ˆโ–ˆโ–ˆ  โ–„โ–„โ–„โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–“
โ–’โ–ˆโ–ˆโ–ˆโ–ˆโ–„    โ–’โ–ˆโ–ˆ    โ–’ โ–’โ–ˆโ–ˆโ–€ โ–€โ–ˆ  โ–“โ–ˆโ–ˆโ–’โ–“โ–ˆโ–ˆโ–’   โ–’โ–ˆโ–ˆโ–ˆโ–ˆโ–„    โ–“โ–ˆโ–ˆ โ–’ โ–ˆโ–ˆโ–’โ–“  โ–ˆโ–ˆโ–’ โ–“โ–’
โ–’โ–ˆโ–ˆ  โ–€โ–ˆโ–„  โ–‘ โ–“โ–ˆโ–ˆโ–„   โ–’โ–“โ–ˆ    โ–„ โ–’โ–ˆโ–ˆโ–’โ–’โ–ˆโ–ˆโ–’   โ–’โ–ˆโ–ˆ  โ–€โ–ˆโ–„  โ–“โ–ˆโ–ˆ โ–‘โ–„โ–ˆ โ–’โ–’ โ–“โ–ˆโ–ˆโ–‘ โ–’โ–‘
โ–‘โ–ˆโ–ˆโ–„โ–„โ–„โ–„โ–ˆโ–ˆ   โ–’   โ–ˆโ–ˆโ–’โ–’โ–“โ–“โ–„ โ–„โ–ˆโ–ˆโ–’โ–‘โ–ˆโ–ˆโ–‘โ–‘โ–ˆโ–ˆโ–‘   โ–‘โ–ˆโ–ˆโ–„โ–„โ–„โ–„โ–ˆโ–ˆ โ–’โ–ˆโ–ˆโ–€โ–€โ–ˆโ–„  โ–‘ โ–“โ–ˆโ–ˆโ–“ โ–‘ 
 โ–“โ–ˆ   โ–“โ–ˆโ–ˆโ–’โ–’โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–’โ–’โ–’ โ–“โ–ˆโ–ˆโ–ˆโ–€ โ–‘โ–‘โ–ˆโ–ˆโ–‘โ–‘โ–ˆโ–ˆโ–‘    โ–“โ–ˆ   โ–“โ–ˆโ–ˆโ–’โ–‘โ–ˆโ–ˆโ–“ โ–’โ–ˆโ–ˆโ–’  โ–’โ–ˆโ–ˆโ–’ โ–‘ 
 โ–’โ–’   โ–“โ–’โ–ˆโ–‘โ–’ โ–’โ–“โ–’ โ–’ โ–‘โ–‘ โ–‘โ–’ โ–’  โ–‘โ–‘โ–“  โ–‘โ–“      โ–’โ–’   โ–“โ–’โ–ˆโ–‘โ–‘ โ–’โ–“ โ–‘โ–’โ–“โ–‘  โ–’ โ–‘โ–‘   
  โ–’   โ–’โ–’ โ–‘โ–‘ โ–‘โ–’  โ–‘ โ–‘  โ–‘  โ–’    โ–’ โ–‘ โ–’ โ–‘     โ–’   โ–’โ–’ โ–‘  โ–‘โ–’ โ–‘ โ–’โ–‘    โ–‘    
  โ–‘   โ–’   โ–‘  โ–‘  โ–‘  โ–‘         โ–’ โ–‘ โ–’ โ–‘     โ–‘   โ–’     โ–‘โ–‘   โ–‘   โ–‘      
      โ–‘  โ–‘      โ–‘  โ–‘ โ–‘       โ–‘   โ–‘           โ–‘  โ–‘   โ–‘              
                   โ–‘                                               
   โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆ    โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆ    โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆ  โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆ โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆ      โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆ              โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆ   
  โ–ˆโ–ˆโ–ˆโ–’โ–’โ–’โ–’โ–’โ–ˆโ–ˆโ–ˆ  โ–ˆโ–ˆโ–ˆโ–’โ–’โ–’โ–’โ–’โ–ˆโ–ˆโ–ˆ  โ–ˆโ–ˆโ–ˆโ–’โ–’โ–’โ–’โ–’โ–ˆโ–ˆโ–ˆโ–’โ–’โ–ˆโ–ˆโ–ˆ โ–’โ–’โ–ˆโ–ˆโ–ˆ      โ–ˆโ–ˆโ–ˆโ–’โ–’โ–’โ–’โ–’โ–ˆโ–ˆโ–ˆ            โ–’โ–’โ–ˆโ–ˆโ–ˆ    
 โ–’โ–ˆโ–ˆโ–ˆ    โ–’โ–ˆโ–ˆโ–ˆ โ–’โ–ˆโ–ˆโ–ˆ    โ–’โ–’โ–’  โ–ˆโ–ˆโ–ˆ     โ–’โ–’โ–’  โ–’โ–ˆโ–ˆโ–ˆ  โ–’โ–ˆโ–ˆโ–ˆ     โ–’โ–ˆโ–ˆโ–ˆ    โ–’โ–ˆโ–ˆโ–ˆ  โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆ  โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆ  
 โ–’โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆ โ–’โ–’โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆ โ–’โ–ˆโ–ˆโ–ˆ          โ–’โ–ˆโ–ˆโ–ˆ  โ–’โ–ˆโ–ˆโ–ˆ     โ–’โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆ โ–’โ–’โ–ˆโ–ˆโ–ˆโ–’โ–’โ–ˆโ–ˆโ–ˆโ–’โ–’โ–’โ–ˆโ–ˆโ–ˆโ–’   
 โ–’โ–ˆโ–ˆโ–ˆโ–’โ–’โ–’โ–’โ–’โ–ˆโ–ˆโ–ˆ  โ–’โ–’โ–’โ–’โ–’โ–’โ–’โ–’โ–ˆโ–ˆโ–ˆโ–’โ–ˆโ–ˆโ–ˆ          โ–’โ–ˆโ–ˆโ–ˆ  โ–’โ–ˆโ–ˆโ–ˆ     โ–’โ–ˆโ–ˆโ–ˆโ–’โ–’โ–’โ–’โ–’โ–ˆโ–ˆโ–ˆ  โ–’โ–ˆโ–ˆโ–ˆ โ–’โ–’โ–’   โ–’โ–ˆโ–ˆโ–ˆ    
 โ–’โ–ˆโ–ˆโ–ˆ    โ–’โ–ˆโ–ˆโ–ˆ  โ–ˆโ–ˆโ–ˆ    โ–’โ–ˆโ–ˆโ–ˆโ–’โ–’โ–ˆโ–ˆโ–ˆ     โ–ˆโ–ˆโ–ˆ โ–’โ–ˆโ–ˆโ–ˆ  โ–’โ–ˆโ–ˆโ–ˆ     โ–’โ–ˆโ–ˆโ–ˆ    โ–’โ–ˆโ–ˆโ–ˆ  โ–’โ–ˆโ–ˆโ–ˆ       โ–’โ–ˆโ–ˆโ–ˆ โ–ˆโ–ˆโ–ˆ
 โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆ   โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–’โ–’โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆ  โ–’โ–’โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆ  โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆ โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆ    โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆ   โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆ โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆ      โ–’โ–’โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆ 
โ–’โ–’โ–’โ–’โ–’   โ–’โ–’โ–’โ–’โ–’  โ–’โ–’โ–’โ–’โ–’โ–’โ–’โ–’โ–’    โ–’โ–’โ–’โ–’โ–’โ–’โ–’โ–’โ–’  โ–’โ–’โ–’โ–’โ–’ โ–’โ–’โ–’โ–’โ–’    โ–’โ–’โ–’โ–’โ–’   โ–’โ–’โ–’โ–’โ–’ โ–’โ–’โ–’โ–’โ–’        โ–’โ–’โ–’โ–’โ–’  
 .d888888  .d88888b   a88888b. dP dP     .d888888             dP   
d8'    88  88.    "' d8'   `88 88 88    d8'    88             88   
88aaaaa88a `Y88888b. 88        88 88    88aaaaa88a 88d888b. d8888P 
88     88        `8b 88        88 88    88     88  88'  `88   88   
88     88  d8'   .8P Y8.   .88 88 88    88     88  88         88   
88     88   Y88888P   Y88888P' dP dP    88     88  dP         dP   

Character encoding

ASCII

  • ASCII - Wikipedia

    ASCII (/หˆรฆskiห/), an acronym for American Standard Code for Information Interchange, is a character encoding standard for representing a particular set of 95 (English language focused) printable and 33 control characters โ€” a total of 128 code points.

    The first 128 code points of Unicode are the same as ASCII.

UTF-8

  • UTF-8 - Wikipedia

    UTF-8 is dominant for all countries/languages on the internet, is used in most standards, often the only allowed encoding, and is supported by all modern operating systems and programming languages.

The UTF-8 encoding of a Unicode code point is between 1 and 4 bytes:

  • 1-byte character: 0xxxxxxx
  • 2-byte character: 110xxxxx 10xxxxxx
  • 3-byte character: 1110xxxx 10xxxxxx 10xxxxxx
  • 4-byte character: 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

About Unicode: