jg-rp
diff --git a/‎jsonpath/env.py‎
Lines changed: 15 additions & 15 deletions b/‎jsonpath/env.py‎
Lines changed: 15 additions & 15 deletions
diff --git a/‎jsonpath/filter.py‎
Lines changed: 9 additions & 13 deletions b/‎jsonpath/filter.py‎
Lines changed: 9 additions & 13 deletions
diff --git a/‎jsonpath/lex.py‎
Lines changed: 23 additions & 73 deletions b/‎jsonpath/lex.py‎
Lines changed: 23 additions & 73 deletions
@@ -25,9 +25,9 @@
 from .filter import UNDEFINED
 from .filter import VALUE_TYPE_EXPRESSIONS
 from .filter import FilterExpression
+from .filter import FilterQuery
 from .filter import FunctionExtension
 from .filter import InfixExpression
-from .filter import Path
 from .fluent_api import Query
 from .function_extensions import ExpressionType
 from .function_extensions import FilterFunction
@@ -40,8 +40,8 @@
 from .path import JSONPath
 from .stream import TokenStream
 from .token import TOKEN_EOF
-from .token import TOKEN_FAKE_ROOT
 from .token import TOKEN_INTERSECTION
+from .token import TOKEN_PSEUDO_ROOT
 from .token import TOKEN_UNION
 from .token import Token
 
@@ -92,7 +92,7 @@ class attributes `root_token`, `self_token` and `filter_context_token`.
     ## Class attributes
 
     Attributes:
-        fake_root_token (str): The pattern used to select a "fake" root node, one level
+        pseudo_root_token (str): The pattern used to select a "fake" root node, one level
             above the real root node.
         filter_context_token (str): The pattern used to select extra filter context
             data. Defaults to `"_"`.
@@ -117,7 +117,7 @@ class attributes `root_token`, `self_token` and `filter_context_token`.
 
     # These should be unescaped strings. `re.escape` will be called
     # on them automatically when compiling lexer rules.
-    fake_root_token = "^"
+    pseudo_root_token = "^"
     filter_context_token = "_"
     intersection_token = "&"
     key_token = "#"
@@ -180,9 +180,9 @@ def compile(self, path: str) -> Union[JSONPath, CompoundJSONPath]:  # noqa: A003
         """
         tokens = self.lexer.tokenize(path)
         stream = TokenStream(tokens)
-        fake_root = stream.current.kind == TOKEN_FAKE_ROOT
+        pseudo_root = stream.current.kind == TOKEN_PSEUDO_ROOT
         _path: Union[JSONPath, CompoundJSONPath] = JSONPath(
-            env=self, selectors=self.parser.parse(stream), fake_root=fake_root
+            env=self, segments=self.parser.parse(stream), pseudo_root=pseudo_root
         )
 
         if stream.current.kind != TOKEN_EOF:
@@ -197,22 +197,22 @@ def compile(self, path: str) -> Union[JSONPath, CompoundJSONPath]:  # noqa: A003
 
                 if stream.current.kind == TOKEN_UNION:
                     stream.next_token()
-                    fake_root = stream.current.kind == TOKEN_FAKE_ROOT
+                    pseudo_root = stream.current.kind == TOKEN_PSEUDO_ROOT
                     _path = _path.union(
                         JSONPath(
                             env=self,
-                            selectors=self.parser.parse(stream),
-                            fake_root=fake_root,
+                            segments=self.parser.parse(stream),
+                            pseudo_root=pseudo_root,
                         )
                     )
                 elif stream.current.kind == TOKEN_INTERSECTION:
                     stream.next_token()
-                    fake_root = stream.current.kind == TOKEN_FAKE_ROOT
+                    pseudo_root = stream.current.kind == TOKEN_PSEUDO_ROOT
                     _path = _path.intersection(
                         JSONPath(
                             env=self,
-                            selectors=self.parser.parse(stream),
-                            fake_root=fake_root,
+                            segments=self.parser.parse(stream),
+                            pseudo_root=pseudo_root,
                         )
                     )
                 else:  # pragma: no cover
@@ -456,21 +456,21 @@ def check_well_typedness(
             if typ == ExpressionType.VALUE:
                 if not (
                     isinstance(arg, VALUE_TYPE_EXPRESSIONS)
-                    or (isinstance(arg, Path) and arg.path.singular_query())
+                    or (isinstance(arg, FilterQuery) and arg.path.singular_query())
                     or (self._function_return_type(arg) == ExpressionType.VALUE)
                 ):
                     raise JSONPathTypeError(
                         f"{token.value}() argument {idx} must be of ValueType",
                         token=token,
                     )
             elif typ == ExpressionType.LOGICAL:
-                if not isinstance(arg, (Path, InfixExpression)):
+                if not isinstance(arg, (FilterQuery, InfixExpression)):
                     raise JSONPathTypeError(
                         f"{token.value}() argument {idx} must be of LogicalType",
                         token=token,
                     )
             elif typ == ExpressionType.NODES and not (
-                isinstance(arg, Path)
+                isinstance(arg, FilterQuery)
                 or self._function_return_type(arg) == ExpressionType.NODES
             ):
                 raise JSONPathTypeError(
 
@@ -23,7 +23,6 @@
 from .function_extensions import FilterFunction
 from .match import NodeList
 from .selectors import Filter as FilterSelector
-from .selectors import ListSelector
 from .serialize import canonical_string
 
 if TYPE_CHECKING:
@@ -494,7 +493,7 @@ def set_children(self, children: List[FilterExpression]) -> None:
         self._expr.set_children(children)
 
 
-class Path(FilterExpression, ABC):
+class FilterQuery(FilterExpression, ABC):
     """Base expression for all _sub paths_ found in filter expressions."""
 
     __slots__ = ("path",)
@@ -504,25 +503,22 @@ def __init__(self, path: JSONPath) -> None:
         super().__init__()
 
     def __eq__(self, other: object) -> bool:
-        return isinstance(other, Path) and str(self) == str(other)
+        return isinstance(other, FilterQuery) and str(self) == str(other)
 
     def children(self) -> List[FilterExpression]:
         _children: List[FilterExpression] = []
-        for segment in self.path.selectors:
-            if isinstance(segment, ListSelector):
-                _children.extend(
-                    selector.expression
-                    for selector in segment.items
-                    if isinstance(selector, FilterSelector)
-                )
+        for segment in self.path.segments:
+            for selector in segment.selectors:
+                if isinstance(selector, FilterSelector):
+                    _children.append(selector.expression)
         return _children
 
     def set_children(self, children: List[FilterExpression]) -> None:  # noqa: ARG002
         # self.path has its own cache
         return
 
 
-class SelfPath(Path):
+class RelativeFilterQuery(FilterQuery):
     """A JSONPath starting at the current node."""
 
     __slots__ = ()
@@ -572,7 +568,7 @@ async def evaluate_async(self, context: FilterContext) -> object:
         )
 
 
-class RootPath(Path):
+class RootFilterQuery(FilterQuery):
     """A JSONPath starting at the root node."""
 
     __slots__ = ()
@@ -606,7 +602,7 @@ async def evaluate_async(self, context: FilterContext) -> object:
         )
 
 
-class FilterContextPath(Path):
+class FilterContextPath(FilterQuery):
     """A JSONPath starting at the root of any extra context data."""
 
     __slots__ = ()
 
@@ -10,41 +10,40 @@
 
 from .exceptions import JSONPathSyntaxError
 from .token import TOKEN_AND
-from .token import TOKEN_BARE_PROPERTY
+from .token import TOKEN_COLON
 from .token import TOKEN_COMMA
 from .token import TOKEN_CONTAINS
 from .token import TOKEN_DDOT
-from .token import TOKEN_DOT_PROPERTY
+from .token import TOKEN_DOT
 from .token import TOKEN_DOUBLE_QUOTE_STRING
 from .token import TOKEN_EQ
-from .token import TOKEN_FAKE_ROOT
+from .token import TOKEN_ERROR
 from .token import TOKEN_FALSE
 from .token import TOKEN_FILTER
 from .token import TOKEN_FILTER_CONTEXT
 from .token import TOKEN_FLOAT
-from .token import TOKEN_FUNCTION
 from .token import TOKEN_GE
 from .token import TOKEN_GT
-from .token import TOKEN_ILLEGAL
 from .token import TOKEN_IN
 from .token import TOKEN_INT
 from .token import TOKEN_INTERSECTION
 from .token import TOKEN_KEY
 from .token import TOKEN_KEYS
+from .token import TOKEN_KEYS_FILTER
+from .token import TOKEN_LBRACKET
 from .token import TOKEN_LE
 from .token import TOKEN_LG
-from .token import TOKEN_LIST_SLICE
-from .token import TOKEN_LIST_START
 from .token import TOKEN_LPAREN
 from .token import TOKEN_LT
 from .token import TOKEN_MISSING
+from .token import TOKEN_NAME
 from .token import TOKEN_NE
 from .token import TOKEN_NIL
 from .token import TOKEN_NONE
 from .token import TOKEN_NOT
 from .token import TOKEN_NULL
 from .token import TOKEN_OR
-from .token import TOKEN_PROPERTY
+from .token import TOKEN_PSEUDO_ROOT
 from .token import TOKEN_RBRACKET
 from .token import TOKEN_RE
 from .token import TOKEN_RE_FLAGS
@@ -53,13 +52,10 @@
 from .token import TOKEN_RPAREN
 from .token import TOKEN_SELF
 from .token import TOKEN_SINGLE_QUOTE_STRING
-from .token import TOKEN_SKIP
-from .token import TOKEN_SLICE_START
-from .token import TOKEN_SLICE_STEP
-from .token import TOKEN_SLICE_STOP
 from .token import TOKEN_TRUE
 from .token import TOKEN_UNDEFINED
 from .token import TOKEN_UNION
+from .token import TOKEN_WHITESPACE
 from .token import TOKEN_WILD
 from .token import Token
 
@@ -86,8 +82,9 @@ class attributes. Then setting `lexer_class` on a `JSONPathEnvironment`.
     """
 
     key_pattern = r"[\u0080-\uFFFFa-zA-Z_][\u0080-\uFFFFa-zA-Z0-9_-]*"
+    name_pattern = key_pattern  # XXX:
 
-    # `not` or !
+    # ! or `not`
     logical_not_pattern = r"(?:not\b)|!"
 
     # && or `and`
@@ -102,28 +99,17 @@ def __init__(self, *, env: JSONPathEnvironment) -> None:
         self.double_quote_pattern = r'"(?P<G_DQUOTE>(?:(?!(?<!\\)").)*)"'
         self.single_quote_pattern = r"'(?P<G_SQUOTE>(?:(?!(?<!\\)').)*)'"
 
-        # .thing
-        self.dot_property_pattern = rf"\.(?P<G_PROP>{self.key_pattern})"
-
-        self.slice_list_pattern = (
-            r"(?P<G_LSLICE_START>\-?\d*)\s*"
-            r":\s*(?P<G_LSLICE_STOP>\-?\d*)\s*"
-            r"(?::\s*(?P<G_LSLICE_STEP>\-?\d*))?"
-        )
-
+        # TODO: separate re literal tokens
         # /pattern/ or /pattern/flags
         self.re_pattern = r"/(?P<G_RE>.+?)/(?P<G_RE_FLAGS>[aims]*)"
 
-        # func(
-        self.function_pattern = r"(?P<G_FUNC>[a-z][a-z_0-9]+)\(\s*"
-
         self.rules = self.compile_rules()
 
     def compile_rules(self) -> Pattern[str]:
         """Prepare regular expression rules."""
         env_tokens = [
             (TOKEN_ROOT, self.env.root_token),
-            (TOKEN_FAKE_ROOT, self.env.fake_root_token),
+            (TOKEN_PSEUDO_ROOT, self.env.pseudo_root_token),
             (TOKEN_SELF, self.env.self_token),
             (TOKEN_KEY, self.env.key_token),
             (TOKEN_UNION, self.env.union_token),
@@ -136,12 +122,10 @@ def compile_rules(self) -> Pattern[str]:
             (TOKEN_DOUBLE_QUOTE_STRING, self.double_quote_pattern),
             (TOKEN_SINGLE_QUOTE_STRING, self.single_quote_pattern),
             (TOKEN_RE_PATTERN, self.re_pattern),
-            (TOKEN_LIST_SLICE, self.slice_list_pattern),
-            (TOKEN_FUNCTION, self.function_pattern),
-            (TOKEN_DOT_PROPERTY, self.dot_property_pattern),
             (TOKEN_FLOAT, r"-?\d+\.\d*(?:[eE][+-]?\d+)?"),
             (TOKEN_INT, r"-?\d+(?P<G_EXP>[eE][+\-]?\d+)?\b"),
             (TOKEN_DDOT, r"\.\."),
+            (TOKEN_DOT, r"\."),
             (TOKEN_AND, self.logical_and_pattern),
             (TOKEN_OR, self.logical_or_pattern),
             *[
@@ -153,6 +137,7 @@ def compile_rules(self) -> Pattern[str]:
             ],
             (TOKEN_WILD, r"\*"),
             (TOKEN_FILTER, r"\?"),
+            (TOKEN_KEYS_FILTER, r"~\?"),  # TODO: get from env
             (TOKEN_IN, r"in\b"),
             (TOKEN_TRUE, r"[Tt]rue\b"),
             (TOKEN_FALSE, r"[Ff]alse\b"),
@@ -162,9 +147,10 @@ def compile_rules(self) -> Pattern[str]:
             (TOKEN_CONTAINS, r"contains\b"),
             (TOKEN_UNDEFINED, r"undefined\b"),
             (TOKEN_MISSING, r"missing\b"),
-            (TOKEN_LIST_START, r"\["),
+            (TOKEN_LBRACKET, r"\["),
             (TOKEN_RBRACKET, r"]"),
             (TOKEN_COMMA, r","),
+            (TOKEN_COLON, r":"),
             (TOKEN_EQ, r"=="),
             (TOKEN_NE, r"!="),
             (TOKEN_LG, r"<>"),
@@ -173,12 +159,12 @@ def compile_rules(self) -> Pattern[str]:
             (TOKEN_RE, r"=~"),
             (TOKEN_LT, r"<"),
             (TOKEN_GT, r">"),
-            (TOKEN_NOT, self.logical_not_pattern),
-            (TOKEN_BARE_PROPERTY, self.key_pattern),
+            (TOKEN_NOT, self.logical_not_pattern),  # Must go after "!="
+            (TOKEN_NAME, self.key_pattern),  # Must go after reserved words
             (TOKEN_LPAREN, r"\("),
             (TOKEN_RPAREN, r"\)"),
-            (TOKEN_SKIP, r"[ \n\t\r\.]+"),
-            (TOKEN_ILLEGAL, r"."),
+            (TOKEN_WHITESPACE, r"[ \n\t\r]+"),
+            (TOKEN_ERROR, r"."),
         ]
 
         return re.compile(
@@ -194,35 +180,7 @@ def tokenize(self, path: str) -> Iterator[Token]:  # noqa PLR0912
             kind = match.lastgroup
             assert kind is not None
 
-            if kind == TOKEN_DOT_PROPERTY:
-                yield _token(
-                    kind=TOKEN_PROPERTY,
-                    value=match.group("G_PROP"),
-                    index=match.start("G_PROP"),
-                )
-            elif kind == TOKEN_BARE_PROPERTY:
-                yield _token(
-                    kind=TOKEN_BARE_PROPERTY,
-                    value=match.group(),
-                    index=match.start(),
-                )
-            elif kind == TOKEN_LIST_SLICE:
-                yield _token(
-                    kind=TOKEN_SLICE_START,
-                    value=match.group("G_LSLICE_START"),
-                    index=match.start("G_LSLICE_START"),
-                )
-                yield _token(
-                    kind=TOKEN_SLICE_STOP,
-                    value=match.group("G_LSLICE_STOP"),
-                    index=match.start("G_LSLICE_STOP"),
-                )
-                yield _token(
-                    kind=TOKEN_SLICE_STEP,
-                    value=match.group("G_LSLICE_STEP") or "",
-                    index=match.start("G_LSLICE_STEP"),
-                )
-            elif kind == TOKEN_DOUBLE_QUOTE_STRING:
+            if kind == TOKEN_DOUBLE_QUOTE_STRING:
                 yield _token(
                     kind=TOKEN_DOUBLE_QUOTE_STRING,
                     value=match.group("G_DQUOTE"),
@@ -264,19 +222,11 @@ def tokenize(self, path: str) -> Iterator[Token]:  # noqa PLR0912
                     value=match.group(),
                     index=match.start(),
                 )
-            elif kind == TOKEN_FUNCTION:
-                yield _token(
-                    kind=TOKEN_FUNCTION,
-                    value=match.group("G_FUNC"),
-                    index=match.start("G_FUNC"),
-                )
-            elif kind == TOKEN_SKIP:
-                continue
-            elif kind == TOKEN_ILLEGAL:
+            elif kind == TOKEN_ERROR:
                 raise JSONPathSyntaxError(
                     f"unexpected token {match.group()!r}",
                     token=_token(
-                        TOKEN_ILLEGAL,
+                        TOKEN_ERROR,
                         value=match.group(),
                         index=match.start(),
                     ),