正規表現の話

id:kusigahamaさんからidコール貰いました。
ブコメで返信だと狭いのでダイアリー。

メールアドレスとして規格に適合してるかの技術的な判定と、「Gmailなら+付きは弾く」っていうサービスとしての判断は別レイヤの話であって、前者を記述したコードで+を弾くべきじゃないと思う。

はてなブックマーク - 404 Blog Not Found:「PHP使いはもう正規表現をblogに書くな」と言わせないでくれ

確かに。まず先にメールアドレスの規格があって、その後に「うちのサービスではどういうアドレスを許容するか」って中の人の判断がある、と。

ローカル部に使用できる文字は以下のASCII文字である。
1. まず、次のASCII文字をそのまま並べた形式(RFC 5321ではDot-string、RFC 5322ではdot-atomと呼ぶ)が使用できる。
* 大小のラテン文字(本来は大文字・小文字は区別されるが、実際には区別されていない実装がほとんどである[3]。一般的には小文字で表記される)
* 数字 * ! # $ % & ' * + - / = ? ^ _ ` { | } ~(実際には、プロバイダサイドで利用可能な記号文字を一部のみに制限している場合が多い)

メールアドレス - Wikipedia

らしいので、Gmailの+付きを許容する方が「メールアドレスにマッチする正規表現」として正しいみたいですね。