]> git.wincent.com - walrat.git/blob - lib/walrat/regexp_parslet.rb
Initial import (extraction from Walrus repo, commit 0c9d44c)
[walrat.git] / lib / walrat / regexp_parslet.rb
1 # Copyright 2007-2010 Wincent Colaiuta. All rights reserved.
2 # Redistribution and use in source and binary forms, with or without
3 # modification, are permitted provided that the following conditions are met:
4 #
5 # 1. Redistributions of source code must retain the above copyright notice,
6 #    this list of conditions and the following disclaimer.
7 # 2. Redistributions in binary form must reproduce the above copyright notice,
8 #    this list of conditions and the following disclaimer in the documentation
9 #    and/or other materials provided with the distribution.
10 #
11 # THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"
12 # AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
13 # IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
14 # ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT HOLDERS OR CONTRIBUTORS BE
15 # LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
16 # CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
17 # SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS
18 # INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
19 # CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
20 # ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
21 # POSSIBILITY OF SUCH DAMAGE.
22
23 require 'walrat'
24
25 module Walrat
26   class RegexpParslet < Parslet
27     attr_reader :hash
28
29     def initialize regexp
30       raise ArgumentError, 'nil regexp' if regexp.nil?
31       self.expected_regexp = /\A#{regexp}/ # for efficiency, anchor all regexps
32     end
33
34     def parse string, options = {}
35       raise ArgumentError, 'nil string' if string.nil?
36       if string =~ @expected_regexp
37         wrapper = MatchDataWrapper.new $~
38         match   = $~[0]
39
40         if (line_count = match.scan(/\r\n|\r|\n/).length) != 0        # count number of newlines in match
41           column_end    = match.jlength - match.jrindex(/\r|\n/) - 1  # calculate characters on last line
42         else                                                          # no newlines in match
43           column_end    = match.jlength + (options[:column_start] || 0)
44         end
45
46         wrapper.start       = [options[:line_start], options[:column_start]]
47         wrapper.end         = [wrapper.line_start + line_count, column_end]
48         wrapper.source_text = match.to_s.clone
49         wrapper
50       else
51         raise ParseError.new('non-matching characters "%s" while parsing regular expression "%s"' % [string, @expected_regexp.inspect],
52                              :line_end    => (options[:line_start] || 0),
53                              :column_end  => (options[:column_start] || 0))
54       end
55     end
56
57     def eql?(other)
58       other.instance_of? RegexpParslet and
59         other.expected_regexp == @expected_regexp
60     end
61
62     def inspect
63       '#<%s:0x%x @expected_regexp=%s>' %
64         [self.class.to_s, self.object_id, @expected_regexp.inspect]
65     end
66
67   protected
68
69     # For equality comparisons.
70     attr_reader :expected_regexp
71
72   private
73
74     def expected_regexp=(regexp)
75       @expected_regexp = (regexp.clone rescue regexp)
76       update_hash
77     end
78
79     def update_hash
80       # fixed offset to avoid collisions with @parseable objects
81       @hash = @expected_regexp.hash + 15
82     end
83   end # class RegexpParslet
84 end # module Walrat