Housekeeping: remove commented-out code.
[quanlib.git] / book.rb
diff --git a/book.rb b/book.rb
index e0ccc841eed4c86600d56e18b0373fc14a138ab2..2f7b7a6afff83e3c5c61225c15ba886f916d975b 100644 (file)
--- a/book.rb
+++ b/book.rb
@@ -1,16 +1,19 @@
 
 require 'nokogiri'
+require 'rubygems'
 require 'zip'
 
-require 'author'
-require 'cover'
-require 'store'
+require_relative 'author'
+require_relative 'classification'
+require_relative 'cover'
+require_relative 'store'
 
 class Book
   @@DC_NS_URL = 'http://purl.org/dc/elements/1.1/'
 
   def initialize(store)
     @author = nil
+    @classification_id = nil
     @cover = nil
     @description = nil
     @path = nil
@@ -20,7 +23,7 @@ class Book
     @volume = nil
   end
 
-  def load_from_file(fileName)
+  def load_from_file!(fileName)
     @path = fileName
     parse_file_name!(fileName)
   end
@@ -52,6 +55,14 @@ class Book
     @author = value
   end
 
+  def classification_id
+    @classification_id
+  end
+
+  def classification_id=(value)
+    @classification_id = value
+  end
+
   def cover
     return @cover
   end
@@ -79,7 +90,7 @@ class Book
     if nil != @author
       result.push('<i>by ' + @author.reading_order + '</i>')
     end
-    
+
     seriesInfo = []
     series = @store.load_series(@series_id)
     if nil != series and nil != series.descr
@@ -92,6 +103,19 @@ class Book
       result.push(seriesInfo.join(' '))
     end
 
+    classification = nil
+    if nil != @classification_id
+      classification = @store.load_classification(@classification_id)
+    end
+    if nil != classification
+      if nil != classification.ddc
+        result.push('Dewey: ' + classification.ddc.to_s)
+      end
+      if nil != classification.lcc
+        result.push('LCC: ' + classification.lcc.to_s)
+      end
+    end
+
     return result.join('<br/>')
   end
 
@@ -129,7 +153,7 @@ class Book
   def series_id
     @series_id
   end
-  
+
   def series_id=(value)
     @series_id = value
   end
@@ -146,6 +170,14 @@ class Book
     @title = value
   end
 
+  def title_grouping
+    if nil == @path
+      return nil
+    end
+
+    return File.basename(@path, '.*')
+  end
+
   def volume
     @volume
   end
@@ -209,6 +241,9 @@ class Book
 
   protected
   def parse_file_name!(file_name)
+    category = nil   # e.g., non-fiction, fan-fiction
+    grouping = ''
+
     parts = file_name.split('/')
     (series_code, @volume, @title) = processTitle(parts[-1])
     if parts.length > 1
@@ -218,6 +253,9 @@ class Book
       @author = Author.new(grouping, reading_order, sort_order)
       @series_id = @store.get_series(grouping, series_code)
     end
+    if parts.length > 2
+      category = parts[-3]
+    end
 
     lc_file_name = file_name.downcase
     if lc_file_name.end_with?(".epub")
@@ -225,12 +263,22 @@ class Book
     elsif lc_file_name.end_with?(".pdf")
       scan_pdf!(file_name)
     end
+
+    @classification_id = @store.find_classification(@author.grouping, File.basename(file_name, '.*'))
+
+    # TODO:  Fix horrible hard-coded strings and paths
+    if ('01_nonfic' == category) && (nil == classification_id)
+      open(Store.unclassified_csv, 'a') do |fd|
+        fd.puts('"' + grouping.to_s + '","' + path + '"')
+      end
+    end
   end
 
-  protected 
+  protected
   def scanEpub!(fileName)
     #puts 'Scanning "' + fileName.to_s + '"...'
     begin
+      Zip.warn_invalid_date = false
       Zip::File.open(fileName) do |zipfile|
         entry = zipfile.find_entry('META-INF/container.xml')
         if nil == entry
@@ -314,7 +362,7 @@ class Book
 
     #---------------------------------------
     # Description
-    
+
     descrNodes = opfDoc.css('dc|description', 'dc' => @@DC_NS_URL)
     if (descrNodes.length > 0)
       descrNode = descrNodes[0]
@@ -365,9 +413,9 @@ class Book
         entry = zipfile.find_entry(href)
 
         if nil == entry
-          # Although the epub standard requires the path to be relative 
+          # Although the epub standard requires the path to be relative
           # to the base of the epub (zip), some books encountered in the
-          # wild have been found to use a bath relative to the location 
+          # wild have been found to use a bath relative to the location
           # of the opf file.
           parts = opfPath.split('/')
           opfBasePath = opfPath.split('/')[0..-2].join('/')
@@ -375,6 +423,14 @@ class Book
           entry = zipfile.find_entry(coverPath)
         end
 
+        unless entry
+          # Another case found in the wild:  cover image is at the root, but path is '../cover.jpeg'
+          if href.start_with? '../'
+            coverPath = href[3..-1]
+            entry = zipfile.find_entry(coverPath)
+          end
+        end
+
         if nil == entry
           puts 'WARNING!  Cover image "' + href + '" not found in file "' + @path + '".'
           return nil